[发明专利]一种基于社团划分的社交网络用户兴趣关联规则挖掘方法在审
| 申请号: | 201310169347.4 | 申请日: | 2013-05-09 |
| 公开(公告)号: | CN103838804A | 公开(公告)日: | 2014-06-04 |
| 发明(设计)人: | 张小松;牛伟纳;罗强;蒲福连;张凡;张蕾;陈瑞东;王东;李宏鸢 | 申请(专利权)人: | 电子科技大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 成都华典专利事务所(普通合伙) 51223 | 代理人: | 徐丰;杨保刚 |
| 地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 社团 划分 社交 网络 用户 兴趣 关联 规则 挖掘 方法 | ||
技术领域
本发明的设计目标是能够挖掘社交网络用户兴趣之间的关联规则。社交网络中存在数量众多的用户,而且各个用户的兴趣不同,关注的事物也不同,目的就是要挖掘不同用户的兴趣之间的关联规则,本方法是数据挖掘的一种简单但且实用的规则,关联规则挖掘属于数据挖掘的一个重要研究课题。
背景技术
在数据挖掘的知识模式中,关联规则是比较重要的一种。关联规则是数据中一种简单但很适用的规则,关联规则模式属于描述性模式,发现关联规则的算法属于无监督学习的方法。传统的关联规则挖掘算法一般用来发现数据库中大多数数据所遵循的规律,但同时在数据库中还存在另一些规律,这些规律由少数数据维持,而这些规则常被人们忽视又出乎人们的意料,具有相当的价值;面对海量数据,使用传统的关联规则算法挖掘出来的规则数据量将会很大,这对用户的理解、解释以及使用规则将带来不便,而且其中大多数规则对用户来讲是不感兴趣的,所以我们通过社团划分对网络用户经行初步划分,再运用用户兴趣之间的关联规则数据挖掘。
社团结构:研究网络性质的物理意义和数学特性发现许多实际网络都具有一个共同性质,即社团结构。整个网络是由若干个“群”或“团”构成,每个群内部的节点之间的连接相对紧密,而各个群之间的连接相对来说比较稀疏。
社团划分:社团发现就是指将网络划分为若干个联系紧密的群,每个群对应于一个网络中的社团结构。
关联规则:关联规则可以表示为X→Y,称X为规则头,Y为规则尾。关联规则的意义是,如果项集X出现在某个购物篮中,则项集Y也有可能出现在这个购物篮中。
支持度:关联规则X→Y的支持度s(Support)指包含项集X和Y的购物篮占所有购物篮的比例,即
置信度:关联规则X→Y的置信度c(Confidence)指包含项集X和Y的购物篮数目与包含X的购物篮数目的比值,即
发明内容
本发明针对传统关联规则挖掘算法面对大量数据,缺乏控制、时间消耗大以 及无关兴趣多的缺陷提供了一种社团划分的社交网络用户兴趣关联规则挖掘方法。该方法将社交网络映射到网络之中然后进行社团划分,然后对各个社团挖掘用户兴趣之间的关联规则。能够高效、快速的挖掘到社交网络中用户兴趣之间的关联规则;基于社团划分进行关联规则挖掘,经过社团划分之后,使得每次挖掘关联规则时处理的规模都较小,这样可以有效的减小关联规则挖掘算法的数据处理规模,以及减小关联规则挖掘的时间消耗,从而使得算法速度较快,效率较高。为实现上述发明目的,本发明采用的技术方案如下:
一种社团划分的社交网络用户兴趣关联规则挖掘方法,包括以下步骤:
步骤一:对社交网络数据进行预处理,其中包括:将社交网络中的用户抽象成网络中的节点,获取包括所有节点构成的集合,两节点之间边构成的集合;
步骤二:根据步骤一预处理的结果通过Jaccard相似度的计算方法计算出所述社交网络中的每两个节点的Jaccard相似度;
所述两节点的Jaccard相似度计算方法如下:
2-1具体地,计算社交网络数据中任意节点i和节点j的Jaccard相似度:
首先分别获取与节点i或节点j相互连接的各个节点以及包含节点i或j本身的节点的集合,既集合Vi或集合Vj;
2-2计算节点i和节点j的Jaccard相似度:集合Vi和Vj的交集与并集的比值,即SIM(Vi,Vj)=(Vi∩Vj)/(Vi∪Vj);
步骤三:根据步骤一所得的所有节点和步骤二所得每对节点的相似度,组成一个节点相似度矩阵;
步骤四:选择步骤三所述节点相似度矩阵中相似度最大的进行聚合,由此获得新的社团;
步骤五:计算所述社交网络数据中两个社团之间的Jaccard相似度;
所述两个社团之间的Jaccard相似度计算方法如下:
5-1具体地,计算社交网络数据中任意社团k和社团l的Jaccard相似度:
首先获取来自社团k的任意节点m和来自社团l的任意节点n;
5-2如所述步骤二的方法计算节点m和节点n的Jaccard相似度;
5-3重复5.1步骤至5.2步骤计算出分别来自社团k和社团l组成的所有节点对的相似度;
5-4根据步骤5.3得出的社团k和社团l的每对节点相似度并根据结果求出平均值,既两个社团之间的Jaccard相似度;
步骤六:根据所述步骤五的方法计算社交网络数据中所有社团间的Jaccard相似度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310169347.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防盗防火门智能控制终端
- 下一篇:一种防止遗忘IC卡的水控机





