[发明专利]一种基于TS-LSTM和DNN的微博转发量预测方法有效
| 申请号: | 201810989381.9 | 申请日: | 2018-08-28 |
| 公开(公告)号: | CN109063927B | 公开(公告)日: | 2021-12-07 |
| 发明(设计)人: | 张路桥;穆圣坤;王娟;李飞;石磊 | 申请(专利权)人: | 成都信息工程大学 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/00;G06N3/04 |
| 代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 谈杰 |
| 地址: | 610225 四川省成都*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 ts lstm dnn 转发 预测 方法 | ||
本发明属于网络信息处理技术领域,公开了一种基于TS‑LSTM和DNN的微博转发量预测方法,利用用户所发布的所有微博作为源数据,提取出用户10个特征作为输入,微博转发数量量级作为输出,建立TS‑LSTM的预测模型,预测出指定微博的转发指数;根据用户自身影响力、用户粉丝影响力、用户与粉丝的微博特征相似度、微博特征以及预测出的转指定微博的转发指数的特征作为输入,以活跃粉丝是否会转发作为输出,最后统计会转发的数量得出预测目标微博最终转发量级。本发明提出的TS‑LSTM算法并使其与DNN结合对微博转发进行了建模预测,实验论证较以往方法至少有5%的提升。
技术领域
本发明属于网络信息处理技术领域,尤其涉及一种基于TS-LSTM和DNN的微博转发量预测方法。
背景技术
目前,业内常用的现有技术是这样的:
微博由于其便捷的应用方式以及开放的信息平台,已经成为了信息扩散和舆论传播的重要平台。微博转发是微博传播的重要途径,也是研究微博信息传播、舆情监控的最关键问题之一。解决这个问题不仅可以更好地理解微博的舆情传播特点,为舆情分析与监控打下基础;还可以通过挖掘用户微博内容的兴趣特点,对用户进行微博推荐或者广告推荐等。
目前,在对微博转发预测方面的文献主要是根据用户历史微博的数据信息来进行训练,进而建立微博转发预测的模型,或者是基于用户自身兴趣的影响力来建立预测模型等,这些方法也存在不足,用户影响力计算中,只是单纯的通过用户的粉丝数和关注数来利用PageRank进行计算,并没有结合更多的用户特征,故影响力计算并不准确。同时随着互联网的发展,微博用户的增多,用户浏览微博的时长增多,微博的转发量也会随着时间呈递增趋势,以往的文献并没有考虑到此问题。另外针对微博转发量预测来说,大多是根据用户微博特征和微博历史转发量来建立预测模型,并没有将微博转发量与该用户粉丝相联系,这样必然会导致最终的结果不准确。
在微博转发预测方面张旸等人针对Twitter用户的转发行为提出了一种基于特征加权的预测模型,最后通过SVM来训练得到预测模型。Bandari等人提出了一种算法来预测新闻能否在Twitter上流行,或者在社交网站上引发热烈讨论,在预测时,文中将流行度按照转发量分为三个档次,即1~20次为低流行度、20~100次为中流行度、100~2400次为高流行度,对这三个档次进行了预测。
综上所述,现有技术存在的问题是:
(1)用户影响力计算中,只是单纯的通过用户的粉丝数和关注数来利用PageRank进行计算,并没有结合更多的用户特征,故影响力计算并不准确。
(2)同时随着互联网的发展,微博用户的增多,用户浏览微博的时长增多,微博的转发量也会随着时间呈递增趋势,以往的文献并没有考虑到此问题。
(3)针对微博转发量预测来说,大多是根据用户微博特征和微博历史转发量来建立预测模型,并没有将微博转发量与该用户粉丝相联系,这样必然会导致最终的结果不准确。
解决上述技术问题的意义:
本发明提出的方法再重新选择特征并改进PageRank算法来计算用户及粉丝影响力,使得其更加准确,同时提出一种TS-LSTM的神经网络模型,将微博转发量随网络发展而呈递增状态考虑在内,另外还有将不同主题的微博进行筛选过滤,使得微博转发量的预测更加准确。最后将微博转发量的预测细化到每个活跃粉丝上,通过用户微博文本特征与粉丝微博兴趣相似度来细化微博转发量的预测。
发明内容
针对现有技术存在的问题,本发明提供了一种基于TS-LSTM和DNN的微博转发量预测方法。
本发明是这样实现的,一种基于TS-LSTM和DNN的微博转发量预测方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都信息工程大学,未经成都信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810989381.9/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





