[发明专利]一种面向微博客平台的社交朋友圈的挖掘方法及系统有效
申请号: | 201310143346.2 | 申请日: | 2013-04-23 |
公开(公告)号: | CN103279482A | 公开(公告)日: | 2013-09-04 |
发明(设计)人: | 程学旗;李静远;贺志明;伍大勇;王元卓 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;梁挥 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 博客 平台 社交 朋友圈 挖掘 方法 系统 | ||
1.一种面向微博客平台的社交朋友圈的挖掘方法,其特征在于,包括:
步骤1,通过微博客平台所提供的数据接口得到待查看用户的朋友列表;
步骤2,针对所述朋友列表中的每个朋友用户,通过微博客平台所提供的数据接口得到所述每个朋友用户的朋友列表;
步骤3,计算所述待查看用户的朋友列表与所述每个朋友用户的朋友列表的邻里相似度;
步骤4,取出邻里相似度大于指定阈值的朋友用户,作为所述待查看用户的现实朋友用户;
步骤5,计算所述待查看用户与所述现实朋友用户所构成的有向连通图中的最强连通子图,所获得的每个最强连通子图构成所述待查看用户的社交朋友圈。
2.如权利要求1所述的社交朋友圈的挖掘方法,其特征在于,所述步骤3包括:
步骤31,取得所述待查看用户的好友列表L(A),并且取得所述L(A)中的一位朋友用户的好友列表L(B);
步骤32,计算所述L(A)和所述L(B)中相同的朋友用户的个数M;
步骤33,计算所述L(A)和所述L(B)中的人数总和N;
步骤34,通过M/N计算所述待查看用户和所述L(B)中的一位朋友用户的邻里相似度;
步骤35,重复执行步骤31至步骤34,直至计算出所述待查看用户与所述每个朋友用户的朋友列表的邻里相似度。
3.如权利要求1所述的社交朋友圈的挖掘方法,其特征在于,所述步骤5包括:
步骤51,将所述待查看用户和每个现实朋友用户作为一个单独结点,所述待查看用户和每个现实朋友的朋友列表中的朋友用户之间的关系当作边,组成有向连通图;
步骤52,从所述有向连通图的任意一个顶点出发,沿以该顶点为尾的边,进行深度优先搜索遍历,并按其所有邻接点的搜索的完成顺序排列顶点;
步骤53,从最后完成搜索的顶点出发,沿着以该顶点为头的弧作逆向的深度优先遍历,遍历所述有向连通图中的所有顶点,若此次遍历不能访问到所述有向联通图中所有顶点,则从其余顶点中最后完成搜索的顶点出发,继续作逆向的深度优先遍历,直至遍历所述有向连通图中的所有顶点;
步骤54,每一次作逆向深度优先遍历所访问的顶点集作为所述有向联通图中的一个最强连通子图的顶点集。
4.一种面向微博客平台的社交朋友圈的挖掘系统,其特征在于,包括:
第一列表获取模块,通过微博客平台所提供的数据接口得到待查看用户的朋友列表;
第二列表获取模块,针对所述朋友列表中的每个朋友用户,通过微博客平台所提供的数据接口得到所述每个朋友用户的朋友列表;
计算模块,计算所述待查看用户的朋友列表与所述每个朋友用户的朋友列表的邻里相似度;
选取模块,取出邻里相似度大于指定阈值的朋友用户,作为所述待查看用户的现实朋友用户;
结果获得模块,计算所述待查看用户与所述现实朋友用户所构成的有向连通图中的最强连通子图,所获得的每个最强连通子图构成所述待查看用户的社交朋友圈。
5.如权利要求4所述的社交朋友圈的挖掘系统,其特征在于,所述计算模块包括:
获取处理模块,取得所述待查看用户的好友列表L(A),并且取得所述L(A)中的一位朋友用户的好友列表L(B);
第一计算模块,计算所述L(A)和所述L(B)中相同的朋友用户的个数M;
第二计算模块,计算所述L(A)和所述L(B)中的人数总和N;
第三计算模块,通过M/N计算所述待查看用户和所述L(B)中的一位朋友用户的邻里相似度;
计算结果获得模块,重复执行步骤31至步骤34,直至计算出所述待查看用户与所述每个朋友用户的朋友列表的邻里相似度。
6.如权利要求4所述的社交朋友圈的挖掘系统,其特征在于,所述结果获得模块包括:
有向连通图获得模块,将所述待查看用户和每个现实朋友用户作为一个单独结点,所述待查看用户和每个现实朋友的朋友列表中的朋友用户之间的关系当作边,组成有向连通图;
第一遍历搜索模块,从所述有向连通图的任意一个顶点出发,沿以该顶点为尾的边,进行深度优先搜索遍历,并按其所有邻接点的搜索的完成顺序排列顶点;
第二遍历搜索模块,从最后完成搜索的顶点出发,沿着以该顶点为头的弧作逆向的深度优先遍历,遍历所述有向连通图中的所有顶点,若此次遍历不能访问到所述有向联通图中所有顶点,则从其余顶点中最后完成搜索的顶点出发,继续作逆向的深度优先遍历,直至遍历所述有向连通图中的所有顶点;
顶点集获得模块,每一次作逆向深度优先遍历所访问的顶点集作为所述有向联通图中的一个最强连通子图的顶点集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310143346.2/1.html,转载请声明来源钻瓜专利网。