[发明专利]一种基于情境信息的人气值预测模型构建与训练方法在审
| 申请号: | 202210477541.8 | 申请日: | 2022-05-04 |
| 公开(公告)号: | CN114723172A | 公开(公告)日: | 2022-07-08 |
| 发明(设计)人: | 陈秉佑;骆瑜 | 申请(专利权)人: | 骆瑜 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06F40/30;G06F17/18;G06F17/10;G06N20/00 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 710049 陕*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 情境 信息 人气 预测 模型 构建 训练 方法 | ||
本发明公开了一种基于情境信息的网络流行语人气值预测模型构建与训练方法,具体包括:模型构建包括获取用户与网络流行语之间的情境数据、计算基于情境特征的网络流行语人气值置信度、计算整体人气值置信度矩阵X、根据人气值置信度矩阵求得各个网络流行语的人气值;模型训练包括使用回归曲线拟合的方法求得各类人气值置信度计算公式中的参数、使用高斯概率线性模型得到人气值的概率分布函数、通过最大化后验概率得到待优化的目标函数、使用梯度下降法优化目标函数。该模型可以从较少的、最新的网络用户行为数据中预测潜在的网络流行语,从而实现基于用户情境信息的流行语预测和发现,与其他方法相比具有更好的性能和更广泛的应用范围。
技术领域
本发明属于机器学习技术领域,涉及一种基于情境信息的网络流行语人气值预测模型构建与训练方法。
背景技术
如今,随着在线媒体和各种移动应用程序的广泛普及,越来越多的人通过网络进行社交、分享、评论和转发各种话题,从而产生了大量的网络流行语。许多研究都集中在为什么有些词汇会爆发和传播并成为网络流行语,而丰富的社会行为数据为这些预测的研究提供了支持。 网络流行语人气值预测在分析网络词汇在未来一段时间内的传播模式流行趋势方面起着至关重要的作用。
然而,现有的网络流行语人气值预测模型多使用在线用户行为数据,如点赞、评论、转发数量等,这会带来一些问题。首先,传播初期的网络流行语用户参与度低,相关的用户行为数据很少。第二,用户对不同话题有不同的偏好,现有的模型在构建与数据处理上会十分复杂。第三,网络流行语具有高度的时间性、空间性和语义性的特点,因此不能简单地通过传统的建模方法,如统计学方法来预测。
发明内容
有鉴于此,本发明的目的在于克服上述现有技术的缺点,提供了一种基于情境信息的网络流行语人气值预测模型构建与训练方法,以解决现有网络流行语人气值预测模型对处于传播过程早期的网络流行语词汇发现能力不足的技术问题。
为达到上述目的,本发明采用以下的技术方案:
本发明的一种基于情境信息的人气值预测模型构建方法,包括如下步骤:
步骤一:获取用户m与网络流行语i之间的情境数据,包括空间距离D(m,i),时间距离T(m,i),归一化的关系评分值NR(m,i),用户从该网络流行语的社交行为中获得的归一化情感得分值NS(m,i);
步骤二:计算基于空间特征的网络流行语人气值置信度CS(m,i),计算公式如下:
其中,N是用户的总数,u,v,w是通过曲线拟合学习得到的参数,下同;
步骤三:计算基于时间特征的网络流行语人气值置信度CT(m,i),计算公式如下:
步骤四:计算基于关系特征的网络流行语人气值置信度CNR(m,i),计算公式如下:
步骤五:计算基于语义特征的网络流行语人气值置信度CNS(m,i),计算公式如下:
步骤六:计算整体人气值置信度矩阵X,计算公式如下:
X=A×CS+B×CT+J×CNR+K×CNS或
Xm,i=AS(m,i)×CS(m,i)+BT(m,i)×CT(m,i)+JNR(m,i)×CNR(m,i)+KNS(m,i)×CNS(m,i)
其中A、B、J、K是CS、CT、CNR、CNS对应的系数矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于骆瑜,未经骆瑜许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210477541.8/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置





