[发明专利]一种基于话题变化趋势的信息流行度预测方法在审
| 申请号: | 202310214902.4 | 申请日: | 2023-03-08 |
| 公开(公告)号: | CN116245241A | 公开(公告)日: | 2023-06-09 |
| 发明(设计)人: | 孙鹤立;高群书;褚旭光;王晨雨 | 申请(专利权)人: | 人民网股份有限公司;西安交通大学 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/00;G06F40/30;G06F40/289;G06N3/04;G06N3/0442 |
| 代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 王艾华 |
| 地址: | 100082 北京市西*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 话题 变化 趋势 信息 流行 预测 方法 | ||
本发明涉及信息流行度预测技术领域,尤其涉及一种基于话题变化趋势的信息流行度预测方法,首先,提取关键词集合来表示话题,构造关键词的趋势变化图;其次,将趋势变化图的整体趋势看作话题突发特征,利用人工提取和图表示学习方法进行特征学习;最后,通过长短期记忆网络对话题突发特征序列进行学习,得到话题变化趋势特征,结合文本语义预测信息流行度。本发明充分考虑到文本内容中话题的变化对传播造成的影响,可以精确地进行流行度预测。
技术领域
本发明涉及信息流行度预测技术领域,具体为一种基于话题变化趋势的信息流行度预测方法。
背景技术
随着在线社交网络的发展,人们可以通过网络随时随地进行沟通,这导致社交网络每天都产生大量的短文本,从中及时检测出热点话题,可以帮助用户获得更好的使用体验,同时,预测某个事件相关信息的未来传播规模,可使平台更早的做出应对措施,所以在线社交网络的话题检测和信息流行度预测就非常重要,当前也有较多的相关研究。
信息流行度预测任务目前国内外已有不少的相关研究,根据模型方法的不同可以分为基于特征构造的方法、基于生成模型的方法和基于深度学习的方法。
1)基于特征构造的方法
基于特征提取的方法是早期比较流行的方法,根据特征的不同类型可以分为用户,内容,时序和结构。用户特征主要包括参与传播的用户粉丝数量、影响力等。时序特征包括发布时间、用户参与时间等。结构特征是对早期传播网络进行建模并分析网络的结构特征。内容特征包括了文本、图片和视频等多种类型。通过对这些特征进行提取后,结合朴素贝叶斯、线性回归等机器学习算法进行预测。
2)基于生成模型的方法
在社交网络上的信息传播预测提出之前,复杂网络传播动力学就在对信息传播过程进行建模,这种方法对传播过程具有较好的可解释性。基于生成模型的信息流行度预测方法将信息传播过程看成是用户转发行为的一个到达过程。按照建模方法不同可以分为传染病模型、随机点过程等。
3)基于深度学习的方法
深度学习算法目前已经在图像识别、自然语言处理等方面证明了其有效性。由于人工特征难以获取,现在已经有许多研究利用深度学习的方法来进行流行度预测。
现有的流行度预测方法多利用传播网络或用户网络,网络结构在信息传播过程中是动态变化的,且结构复杂,不便于获取和分析,网络未知的方法在处理文本时大多只提取语义信息,而没有考虑到文本内容中话题的变化同样会对传播造成影响。
发明内容
针对现有技术中存在的问题,本发明提供一种基于话题变化趋势的信息流行度预测方法。
本发明是通过以下技术方案来实现:
一种基于话题变化趋势的信息流行度预测方法,包括以下步骤:
S1,从已公开的数据集中提取表示话题的关键词集合,并构建关键词集合的趋势变化图和词汇共现图;
S2,以趋势变化图的整体趋势作为话题突发特征,利用人工提取方式对话题突发特征进行特征学习,获取人工特征序列;利用图表示学习方法对话题突发特征进行特征学习,获取词汇共现图向量和趋势变化图向量;
S3,通过长短期记忆网络对人工特征序列、词汇共现图向量和趋势变化图向量进行学习,获取话题变化趋势特征;将话题变化趋势特征与文本语义预测信息流行度结合,预测话题的流行度。
优选的,在S1中,构建趋势变化图和词汇共现图的具体步骤如下:
S11,令每个节点为一个三元组,表示用户在时间发布或转发相关的信息,包含内容为,按照时间划分观察期和预测期;
S12,对已公开的数据集中的短文本按照观察期进行划分,获得观察期短文本集合;其中,每个观察期短文本集合作为一个样本,包括观察期内用户产生的所有短文本,记作,其中表示短文本是用户在时间发布,包含的文字内容为;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于人民网股份有限公司;西安交通大学,未经人民网股份有限公司;西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310214902.4/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





