[发明专利]基于微博主题进行微博转发路径预测的方法和系统在审
申请号: | 201611183018.5 | 申请日: | 2016-12-20 |
公开(公告)号: | CN106599243A | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 陈雁;郭培伦;彭欣宇;李平;胡栋;葛忆;李永乐 | 申请(专利权)人: | 西南石油大学;四川数智汇通数据有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00 |
代理公司: | 成都金英专利代理事务所(普通合伙)51218 | 代理人: | 袁英 |
地址: | 610500 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 主题 进行 转发 路径 预测 方法 系统 | ||
技术领域
本发明涉及信息传播技术领域,特别是涉及一种基于微博主题进行微博转发路径预测的方法和系统。
背景技术
微博(Weibo),即微型博客(MicroBlog)的简称,也即是博客的一种,是一种通过关注机制分享简短实时信息的广播式的社交网络平台。微博是一个基于用户关系信息分享、传播以及获取的平台。用户可以通过WEB、WAP等各种客户端组建个人社区,以140字(包括标点符号)的文字更新信息,并实现即时分享。微博的关注机制分为可单向、可双向两种。
微博作为一种分享和交流平台,其更注重时效性和随意性。微博客更能表达出每时每刻的思想和最新动态,而博客则更偏重于梳理自己在一段时间内的所见、所闻、所感。因微博而诞生出微小说这种小说体裁。中国互联网络信息中心(CNNIC)于2011年7月19日发布《第28次中国互联网络发展状况统计报告》,报告显示,2011年上半年,中国微博用户从6331万增至1.95亿,增长约2倍。微博在网民中的普及率从13.8%增至40.2%。从2010年底至今,手机微博在网民中的使用率比例从15.5%上升到34%。
截至2014 年6 月底,我国微博用户规模为2.75 亿,用户之间结成复杂的关注关系,每天发送微博近1 亿条,信息沿着用户间的关注关系进行传播,形成传播扩散网络。微博转发是消息在微博网络中得到持续传播的重要方式,微博转发路径预测能够有效估计微博的传播范围及其路径,对微博突发性检测和微博影响力评估具有重要意义。
发明内容
本发明的目的在于克服现有技术的不足,提供一种基于微博主题进行微博转发路径预测的方法和系统,根据微博的主题来进行微博转发路径的预测。
本发明的目的是通过以下技术方案来实现的:基于微博主题进行微博转发路径预测的方法,包括:
获取并存储预设时间窗内各微博的微博内容及微博转发关系;
根据微博内容对所述时间窗内的微博进行主题分类;
为每个微博主题建立微博转发关系网络;
计算每个微博主题的微博转发关系网络中各边的权重;
根据各微博转发关系网络中各边的权重进行微博转发路径预测。
根据微博内容对所述时间窗内的微博进行主题分类的方法,包括:
利用预设的主题模型对所述时间窗内的微博进行主题分类;
存储各微博主题中各微博的转发关系。
为每个微博主题建立微博转发关系网络的方法,包括:
根据各微博主题中各微博的转发关系,建立有向图网络:将各微博用户作为有向图网络中的节点,若第一微博用户关注了第二微博用户,则构建一条从第二微博用户至第一微博用户的有向边。
计算每个微博主题的微博转发关系网络中各边的权重的方法,包括:
定义一个微博用户关注了另一个微博用户,则该微博用户为该另一个微博用户的粉丝;
统计该主题中微博用户x被转发的微博总数Nx,该微博用户x的粉丝y转发的该微博用户x的微博总数ny;
计算所述微博转发关系网络中各边的权重,公式如下:
W=Nx/ny。
根据各微博转发关系网络中各边的权重进行微博转发路径预测的方法,包括:
定义发布微博的微博用户对应的节点为源点v,集合S为从源点v出发的终点的集合,初始时集合S只包含源点v,即S={v};集合U为包含微博转发关系网络中除源点v外的所有节点的集合;
判断集合U中的节点u是否为源点v的出边邻接点,若是,则<u,v>的权值为节点u和源点v连接边的权重;否则,<u,v>的权值为∞;
更新最短路径:从集合U中选择一个到源点v距离最小的节点k,并将节点k加入集合S;将节点k作为新的中间点,更新下集合U中各节点到中间点的边的权值;若源点v经过中间点k到节点u的边的权值之和小于原来路径的权值之和,则将该经过中间点k的路径作为源点v到节点u的路径;
重复更新最短路径的步骤,直到找出集合U中到源点v的最短路径的权值之和小于阈值的节点。
基于微博主题进行微博转发路径预测的系统,包括:
数据爬取模块,获取并存储预设时间窗内各微博的微博内容及微博转发关系;
分类模块,根据微博内容对所述时间窗内的微博进行主题分类;
分析模块,为每个微博主题建立微博转发关系网络;计算每个微博主题的微博转发关系网络中各边的权重;
预测模块,根据各微博转发关系网络中各边的权重进行微博转发路径预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南石油大学;四川数智汇通数据有限公司,未经西南石油大学;四川数智汇通数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611183018.5/2.html,转载请声明来源钻瓜专利网。