[发明专利]一种基于社团划分的社交网络用户兴趣关联规则挖掘方法在审

专利信息
申请号: 201310169347.4 申请日: 2013-05-09
公开(公告)号: CN103838804A 公开(公告)日: 2014-06-04
发明(设计)人: 张小松;牛伟纳;罗强;蒲福连;张凡;张蕾;陈瑞东;王东;李宏鸢 申请(专利权)人: 电子科技大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 成都华典专利事务所(普通合伙) 51223 代理人: 徐丰;杨保刚
地址: 611731 四川省成*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种社团划分的社交网络用户兴趣关联规则挖掘方法,首先对数据进行基于相似度的分类预处理,使得同一分类中的记录间具有高相似度;其次对每个分类中的数据进行相关联挖掘,得到各分类的频繁项集;最后合并所有分类的频繁项集,选择置信度大于置信度阀值的候选关联规则生成最终的关联规则集合。本发明能够减少产生不必要的关联性小的候选项集,从而提高整体数据的关联规则挖掘效率,具有更好的扩展性。
搜索关键词: 一种 基于 社团 划分 社交 网络 用户 兴趣 关联 规则 挖掘 方法
【主权项】:
1.一种社团划分的社交网络用户兴趣关联规则挖掘方法,包括以下步骤: 步骤一:对社交网络数据进行预处理,其中包括:将社交网络中的用户抽象成网络中的节点,获取包括所有节点构成的集合,两节点之间边构成的集合; 步骤二:根据步骤一预处理的结果通过Jaccard相似度的计算方法计算出所述社交网络中的每两个节点的Jaccard相似度; 所述两节点的Jaccard相似度计算方法如下: 2-1具体地,计算社交网络数据中任意节点i和节点j的Jaccard相似度:首先分别获取与节点i或节点j相互连接的各个节点以及包含节点i或j本身的节点的集合,既集合Vi或集合Vj; 2-2计算节点i和节点j的Jaccard相似度:集合Vi和Vj的交集与并集的比值,即SIM(Vi,Vj)=(Vi∩Vj)/(Vi∪Vj); 步骤三:根据步骤一所得的所有节点和步骤二所得每对节点的相似度,组成一个节点相似度矩阵; 步骤四:选择步骤三所述节点相似度矩阵中相似度最大的进行聚合,由此获得新的社团; 步骤五:计算所述社交网络数据中两个社团之间的Jaccard相似度; 所述两个社团之间的Jaccard相似度计算方法如下: 5-1具体地,计算社交网络数据中任意社团k和社团l的Jaccard相似度:首先获取来自社团k的任意节点m和来自社团l的任意节点n; 5-2如所述步骤二的方法计算节点m和节点n的Jaccard相似度; 5-3重复5.1步骤至5.2步骤计算出分别来自社团k和社团l组成的所有节点对的相似度; 5-4根据步骤5.3得出的社团k和社团l的每对节点相似度并根据结果求出平均值,既两个社团之间的Jaccard相似度; 步骤六:根据所述步骤五的方法计算社交网络数据中所有社团间的Jaccard相似度; 步骤七:根据所述社交网络数据中社团和所述步骤六计算的结果,构成网络中各个社团的社团相似度矩阵; 步骤八:根据步骤七所述社团相似度矩阵中相似度最大的社团进行聚合, 构成新的社团; 步骤九:重复步骤五至步骤八,直到整个网络聚合成一个社团为止; 步骤十:设定关联规则的支持度阀值和置信度阀值,关联规则X→Y的支持度定义为(XUY).count表示包含X和Y的项集的数目,n表示所有项集的数目。关联规则X→Y的置信度定义为(XUY).count表示包含X和Y的项集的数目,X.count表示包含X的项集的数目;步骤十一:根据步骤十所得数据获取用户兴趣集合; 步骤十二:计算用户兴趣集合中的兴趣的支持度,选择支持度大于所述支持度阀值的兴趣构成1阶频繁项集; 步骤十三:由k-1阶频繁项集生成k阶候选频繁项集,具体方式是在k-1阶频繁项集中选择任意两个项集,选择两个项集中只有一项不同,则合并这两个k-1阶频繁项集构成一个k阶候选频繁项集,统计k阶候选频繁项集在数据集中出现的次数,进而计算所有k阶候选频繁项集的支持度,选择支持度大于支持度阀值的候选频繁项构成k阶频繁项集; 步骤十四:重复步骤十三直至没有更高阶的频繁项集为止; 步骤十五:对于任意频繁项集f,计算所有候选关联规则(f-a)→a的置信度,选择置信度大于置信度阀值的候选关联规则生成最终的关联规则集合。 
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201310169347.4/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top