[发明专利]一种融合网络结构和文本信息的社交关系预测方法有效
申请号: | 201711143539.2 | 申请日: | 2017-11-17 |
公开(公告)号: | CN107729569B | 公开(公告)日: | 2020-01-17 |
发明(设计)人: | 张子柯;许帅帅;尤志强;周鸽;刘闯 | 申请(专利权)人: | 杭州师范大学 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06Q10/04;G06Q50/00 |
代理公司: | 33201 杭州天正专利事务所有限公司 | 代理人: | 王兵;黄美娟 |
地址: | 311121 浙江省杭州*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 网络 结构 文本 信息 社交 关系 预测 方法 | ||
一种融合网络结构和文本信息的社交关系预测方法,包括如下步骤:步骤1,构造原始兴趣向量;步骤2,构造修正兴趣向量;步骤3,重构用户兴趣向量;步骤4,预测社会关系。本发明综合考虑了社交网络中的文本信息和结构信息,解决了类似于微博和推特等社交网络平台上的链路预测问题和推荐问题;给出了一个可以应用在不同社交平台上的链路预测问题的统一解决框架;由于应用了word2vec,IKanalyzer等开源包,采用了兴趣向量,修正兴趣向量,桥接点等机制,所以达到了很高的预测准确度;丰富了对于链路预测方法的认识和理解。
技术领域
本发明涉及社交网络上的关系预测,尤其适用于解决在类似于微博这样不仅仅有网络结构信息而且还包含丰富的文本信息的网络上的链路预测问题。
背景技术
链路预测由于其在复杂网络、社会网络和生物网络等领域的广泛应用,已经吸引了各个领域研究者的关注。链路预测的目标是根据网络中已观测到的部分信息来估计我们尚未观察到的边的存在可能性。迄今为止,链路预测算法已经成功地应用于从生物学到电子商务的许多领域。例如,使用有效的链路预测方法可以给出蛋白质-蛋白质相互作用网络中最有可能存在的连边,这样就不用对每一个可能的连边进行实验,大大降低了实验成本。链路预测方法也可以用于推荐,最近的研究结果表明它们比标准的协同过滤算法的表现更好。
在微博这样的社交网络平台上,如果可以准确的预测用户之间的关注关系,这将有助于帮助新用户构建其社交圈,并且也将增强用户的参与感。对于这样的平台来说这是至关重要的。在网络科学领域,一系列基于节点属性和网络拓扑结构的链路预测方法已经被提出。其中基于局部相似性指标的方法包括common neighbors,Jaccard coefficient和Adamic/Adar。例如common neighbors计算用户间共有的邻居数量,因为基于经验可以发现,拥有更多共同邻居的用户之间更容易存在连边。考虑全局的网络拓扑结构信息的链路预测算法包括Katz,Hitting Time,Commute Time,local random walk等等。然而这些已经存在的方法大多是基于只有网络拓扑结构信息可用而没有文本信息可用的网络。通过对微博和推特数据的分析发现,有关注关系的用户之间存在共同的兴趣,信息传播中的关键节点有助于提高信息的扩散。另外根据以往的研究表明,人们通常会有在社交平台上表达情感和展现意愿的倾向,这将有利于我们收集用于描述用户兴趣的有用信息。基于以上的讨论本分发明提出了一种新的算法,称为Maximum Preference on Interest Similarity(MPIS),该算法充分利用了文本内容和网络结构信息来解决社交网络上的链路预测问题。
针对类似于推特和微博这样的社交网络,由于其不同于传统的只有网络结构信息的网络,经典的链路预测方法不能够有效的利用其所包含的丰富的文本信息,这将会导致大量有用信息的丢失,降低链路预测的效果。
发明内容
本发明要解决现有技术只考虑网络拓扑结构而忽略文本信息,以及计算量大,计算效率低下的缺点,提供一种基于网络结构和文本信息的社交关系预测方法。
本发明利用微博和推特社交网络平台上拥有的数量丰富的用户文本信息,结合网络拓扑结构信息发明了一种链路预测的方法。在技术上实现了对用户关注关系的预测问题,丰富了对于链路预测问题的认识和理解。
一种融合网络结构和文本信息的社交关系预测方法,包括如下步骤:
步骤1,构造原始兴趣向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州师范大学,未经杭州师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711143539.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种能减少LED所需使用数量的背光模组
- 下一篇:背光模组及显示装置