[发明专利]基于三部图模型的微博热点话题溯源方法有效
申请号: | 201810040609.X | 申请日: | 2018-01-16 |
公开(公告)号: | CN108170842B | 公开(公告)日: | 2021-12-14 |
发明(设计)人: | 肖寒春;于海洋;李艳军;陈迪强 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/958;G06Q50/00 |
代理公司: | 重庆辉腾律师事务所 50215 | 代理人: | 王海军 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 三部 模型 热点话题 溯源 方法 | ||
1.基于三部图模型的微博热点话题溯源方法,其特征在于,包括:
S1、利用网络爬虫或者各种社交软件提供的应用程序编程接口API对数据进行获取;
S2、对单条微博消息进行传播路径模型还原;
S3、以单条微博消息的传播路径还原为基础,建立“消息-路径-用户”话题三部图,具体包括以下步骤:
S31、构建“消息-路径-用户”话题三部图模型,根据同一用户可能会对不同消息进行转发与评论,使多条消息传播具有重叠,从而构成话题全网络,以此为基础构建话题三部图,具体表示包括:
G=(M∪P∪V,A∪B);
其中,G表示话题三步图模型,M={M1,M2,M3,...,Mi}为消息集合,P={P1,P2,P3,...,Pi}为消息传播路径集合,V={V1,V2,V3,...,Vi}为参与用户集合,A为消息-路径之间的权值矩阵,B为路径-用户之间的权值矩阵;
S32、同一个用户可能会同时参与此热点话题下不同消息,定义用户话题传播带动力为:
其中,drive(vk,mi)为用户的消息传播带动力,vk,mi表示第i个消息中的用户节点vk;
S33、引进超文本话题搜索HITS排名思想,使用循环迭代打分机制对话题三部图中关键元素进行挖掘,挖掘过程包括:
S331、计算消息初始评分向量X(0)、路径初始评分向量Y(0)和用户初始评分向量W(0),分别表示为:
其中,αi表示的是消息传播的广度,即消息Mi所对应的有效路径;βj表示的是路径pj的对应的节点vk的数目,γk表示的是用户节点vk的话题传播带动力,上标T表示转置矩阵;
S332、计算消息-路径之间的权值矩阵和路径-用户之间的权值矩阵,分别表示为:
消息-路径权值矩阵为:
路径-消息权值矩阵为:
其中,如果消息M中有传播路径P,则ai,j=1,否则,ai,j=0;同时,把AMP看成是消息节点M和路径节点P之间的转移矩阵;
路径-用户权值矩阵为:
用户-路径权值矩阵为:
其中,若传播路径Pj中包含用户节点vk,则bk,j=1,否则bk,j=0,是用户初始分值向量W(0)的第k个元素,是路径初始分数Y(0)的第j个元素;
S333、使用循环迭代打分机制对三部图中的消息集合、路径集合、用户集合的分值向量进行更新,其中循环迭代打分机制包括正向打分过程和反向打分过程,即:
正向打分过程包括:
Y(n+1)=μAMPX(n)+(1-μ)Y(0);
W(n+1)=μBPVY(n+1)+(1-μ)W(0);
其中,μ为可调比例参数,Y(n+1)表示第n+1次循环的路径评分向量,W(n+1)表示第n+1次循环的用户评分向量,AMP表示消息-路径权值矩阵,BPV表示路径-用户权值矩阵;
反向打分过程包括:
Y(n+1)=μBVPW(n+1)+(1-μ)Y(0);
X(n+1)=μAPMY(n+1)+(1-μ)X(0);
其中,X(n+1)表示第n+1次循环的消息评分向量;BVP表示用户-路径权值矩阵,APM表示路径-消息权值矩阵;
S4、对根据话题三部图计算得到的消息、路径和用户得分序列排序,将排名靠前的N个作为热点话题源点序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810040609.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于信息价值的手机舆情分析决策方法
- 下一篇:用于获取数据的方法和装置