[发明专利]一种面向微博客平台的社交朋友圈的挖掘方法及系统有效
申请号: | 201310143346.2 | 申请日: | 2013-04-23 |
公开(公告)号: | CN103279482A | 公开(公告)日: | 2013-09-04 |
发明(设计)人: | 程学旗;李静远;贺志明;伍大勇;王元卓 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;梁挥 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 博客 平台 社交 朋友圈 挖掘 方法 系统 | ||
技术领域
本发明涉及互联网信息管理领域,尤其涉及一种面向微博客平台的社交朋友圈的挖掘方法及系统。
背景技术
人们对社交关系有两个最基本的需求,即关系拓展和关系维系。互联网初期,因人们尚沉醉于互联网前所未有的开放性,更多的互联网应用是基于粗放型的关系拓展需求的,也就是基于多关系纽带的泛关系的建立。如早期的BBS、聊天室等应用,其用户多以个人偏好作为关系纽带,而这些应用,也多是围绕不同的偏好来建立不同的社交版块。这时,关系拓展的作用要大于关系维系,也就是交友是基本的需求。
但随着互联网的进化,社交网络给人们提供了跟踪朋友、熟人和家人生活的方法之后,使用社交网络的人数成指数级增长。社交网络开始由关系拓展走向了关系维系,尤其是现实关系的维系。按照“邓巴数字”的理论,人们可管理的强关系,是有限的。社交网站成了人们维系现实关系的工具。
随着国外的facebook、twitter以及国内的人人、新浪微博等社交网络平台的逐步流行,如何从上亿的海量用户中自动挖掘亲密朋友圈子成为了一个重要也非常必要的工作。所谓“亲密朋友圈子”,指的是在同一SNS平台上形成非常紧密的互相关注关系的,并且在线下也互相认识的人群,比如新浪微博里用户有小学同学、中学同学、大学同学、以前的同事、现在的同事、家人、兴趣团体等等社交圈子。对这些社交圈子的挖掘是很有实际用处的。
如果能够从海量用户中通过自动手段挖掘出一个个的兴趣圈子,对于很多具体应用来说是非常重要的基础数据,比如可以利用用户所属社交圈子进行人物推荐,或者根据所属社交圈子的群体特性分析用户的兴趣点等,所以在SNS平台下,如何对海量数据自动进行社交圈子挖掘是个非常有用的基础功能。
发明内容
本发明的发明目的是提供一种面向微博客平台的社交朋友圈的挖掘方法及系统,以在海量用户中自动挖掘社交朋友圈子。
为实现上述发明目的,本发明的一种面向微博客平台的社交朋友圈的挖掘方法,包括:
步骤1,通过微博客平台所提供的数据接口得到待查看用户的朋友列表;
步骤2,针对所述朋友列表中的每个朋友用户,通过微博客平台所提供的数据接口得到所述每个朋友用户的朋友列表;
步骤3,计算所述待查看用户的朋友列表与所述每个朋友用户的朋友列表的邻里相似度;
步骤4,取出邻里相似度大于指定阈值(0.4-0.6)的朋友用户,作为所述待查看用户的现实朋友用户(本发明认为在社交网络上的现实朋友用户是对应着用户在线下相互认识的朋友);
步骤5,计算所述待查看用户与所述现实朋友用户所构成的有向连通图中的最强连通子图(也称最大连通子图,把图的所有结点用最少的边将其连接起来的子图),所获得的每个最强连通子图构成所述待查看用户的社交朋友圈。
进一步的,所述步骤3包括:
步骤31,取得所述待查看用户的好友列表L(A),并且取得所述L(A)中的一位朋友用户的好友列表L(B);
步骤32,计算所述L(A)和所述L(B)中相同的朋友用户的个数M;
步骤33,计算所述L(A)和所述L(B)中的人数总和N;
步骤34,通过M/N计算所述待查看用户和所述L(B)中的一位朋友用户的邻里相似度;
步骤35,重复执行步骤31至步骤34,直至计算出所述待查看用户与所述每个朋友用户的朋友列表的邻里相似度。
进一步的,所述步骤5包括:
步骤51,将所述待查看用户和每个现实朋友用户作为一个单独结点,所述待查看用户和每个现实朋友的朋友列表中的朋友用户之间的关系当作边,组成有向连通图;
步骤52,从所述有向连通图的任意一个顶点出发,沿以该顶点为尾的边,进行深度优先搜索遍历,并按其所有邻接点的搜索的完成顺序排列顶点;
步骤53,从最后完成搜索的顶点出发,沿着以该顶点为头的弧作逆向的深度优先遍历,遍历所述有向连通图中的所有顶点,若此次遍历不能访问到所述有向联通图中所有顶点,则从其余顶点中最后完成搜索的顶点出发,继续作逆向的深度优先遍历,直至遍历所述有向连通图中的所有顶点;
步骤54,每一次作逆向深度优先遍历所访问的顶点集作为所述有向联通图中的一个最强连通子图的顶点集。
为实现上述发明目的,本发明还提供一种面向微博客平台的社交朋友圈的挖掘系统,该系统包括:
第一列表获取模块,通过微博客平台所提供的数据接口得到待查看用户的朋友列表;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310143346.2/2.html,转载请声明来源钻瓜专利网。