[发明专利]基于时间关联交互融合的网络社区帖子影响排序方法在审

专利信息
申请号: 201611249593.0 申请日: 2016-12-29
公开(公告)号: CN106886561A 公开(公告)日: 2017-06-23
发明(设计)人: 胡卫明;游强;吴偶 申请(专利权)人: 中国科学院自动化研究所
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 北京瀚仁知识产权代理事务所(普通合伙)11482 代理人: 李飞,吴晓芬
地址: 100080 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 时间 关联 交互 融合 网络 社区 帖子 影响 排序 方法
【说明书】:

技术领域

发明涉及网络挖掘与社会计算技术领域,特别涉及一种基于时间关联交互融合的网络社区帖子影响排序方法。

背景技术

随着网络的蓬勃发展,越来越多的用户喜欢在网上交流兴趣、发表见解。于是,有一些很有影响力的帖子涌现出来,吸引了大量的用户参与。不同于整个互联网络不加选择地收录庞杂的信息,网络社区常常关注一个或者几个相关的领域,这些网络社区成为了特定领域研究者快速获取信息或者做出决策的理想之地。鉴于一些网络社区的影响力、活跃度以及作为特定领域稳定的内容发布平台,挖掘网络社区并找出有价值的或者潜在影响力大的帖子就成为亟待解决的问题。

某些网络社区具有特定的网络结构(显式的或者是隐含的)。比如一个经典的以线索组织的讨论区的结构如图1所示。纵轴反映了各个组织的线索,横轴反映的是时间线的向前发展,每个线索中各讨论帖子通过交互回复向前推进。基于影响的基本分析方法,潜在影响与帖子的质量高度相关,同时与线索中帖子回复的活跃度也紧密联系,前者考虑的帖子本身的内容信息,而后者则反映了整个线索所包含的结构信息。网络交互的帖子除了内容和结构信息之外,还包含有丰富的元数据,比如发帖时间戳、发帖人的信息等。发帖的时间戳之间的间隔也反映了线索中帖子的活跃度,这在以往的工作中往往被忽视。

有鉴于此,特提出本发明。

发明内容

为了解决现有技术中的上述问题,即为了解决网络社区中潜在影响源的发现问题而提供一种基于时间关联交互融合的网络社区帖子影响排序方法。

为了实现上述目的,提供以下技术方案:

一种基于时间关联交互融合的网络社区帖子影响排序方法,该方法包括:

确定基于时间关联的影响排序;

根据文本语义模型,对帖子的文本内容进行语义建模,构建基于语义上下文相似度的语义树;

按照统一的交互融合算法,将帖子的文本语义和网络社区的结构信息融合在一起,对帖子的影响进行排序。

优选地,确定基于时间关联的影响排序具体包括:

对网络社区线索的帖子进行筛选,提取线索中各帖子发表的时间戳;

针对提取的时间戳,确定帖子在线索中的时效性函数和时间关联权重;

按照随机游走算法,并通过迭代的方法,确定时间关联的影响排序。

优选地,根据文本语义模型,对帖子的文本内容进行语义建模,构建基于语义上下文相似度的语义树,具体包括:

按照文本语义模型提取网络社区各线索中帖子的文本语义特征;

基于文本语义特征,以线索为组织方式,通过帖子之间的语义关联程度,将线索中帖子的集合构建为语义树。

优选地,基于文本语义特征,以线索为组织方式,通过帖子之间的语义关联程度,将线索中帖子的集合构建为语义树,具体包括:

在文本语义模型下,计算线索中帖子之间的语义上下文相似度;

根据帖子发表的时间戳,确定线索中帖子的父节点备选集合;

基于父节点备选集合,根据下式,确定线索中帖子的父节点,从而构建语义树:

其中,L*表示帖子;Li表示在文本语义模型下,线索包含的帖子的文本语义特征,i、j=1......M;M表示线索所含帖子的数量。

优选地,在文本语义模型下,计算线索中帖子之间的语义上下文相似度,具体包括:

根据下式计算方向相似度:

其中,Scos(Li,Lj)表示方向相似度;Lj表示在文本语义模型下,线索包含的帖子的文本语义特征,i<j,j=1......M;

根据下式计算幅度相似度:

其中,Sstr(Li,Lj)表示幅度相似度;

根据下式计算在文本语义模型下,线索中帖子之间的语义上下文相似度:

其中,S(Li,Lj)表示线索中帖子之间的语义上下文相似度;λ表示控制方向相似度和幅度相似度的权重。

优选地,文本语义模型包括以词频倒文档频率TFIDF为代表的词包模型、概率潜在语义索引pLSI模型以及潜在狄利克雷分配LDA模型;

该方法还包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611249593.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top