[发明专利]基于迭代优化策略的多模态信息社交媒体流行度预测方法有效
申请号: | 202010942007.0 | 申请日: | 2020-09-09 |
公开(公告)号: | CN111984872B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 毛震东;张勇东;黄梦琪 | 申请(专利权)人: | 北京中科研究院;中国科学技术大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06F16/432;G06F16/435 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;韩珂 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 优化 策略 多模态 信息 社交 媒体 流行 预测 方法 | ||
本发明公开了一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,为了解决多模态数据利用不充分的缺陷,从帖子中提取了多模态特征;为了增强特征的时效稳定性,使用滑动窗口中对帖子特征进行平均,再进行多模态特征的融合,融合的特征利用LightGBM模型进行回归预测。为了解决流行度极值预测的难点,提出了一种迭代优化的策略,有效补偿了预测流行度分数的残差,特别是极值补偿。通过在SMPD2020数据集上进行的大量实验,取得了较好的效果,证明了本方法的有效性。
技术领域
本发明涉及人工智能技术领域,尤其涉及一种基于迭代优化策略的多模态信息社交媒体流行度预测方法。
背景技术
随着互联网技术的发展以及智能终端设备的兴起,社交媒体已成为人们生活的重要组成部分。与传统媒体不同,Flickr、Facebook、Twitter等现代社交媒体平台更多地依靠用户关系网络进行信息交流和传播。然而,由于网络中的信息过载、用户注意力有限,社交媒体上的信息存在关注不均衡的情况。因此,利用用户信息、帖子等进行社交媒体流行度预测,具有很高的研究价值和商业价值,也可以帮助内容创作者制作出更受欢迎的作品。
现有的社交媒体流行度预测工作,主要分为以下几个步骤:提取可能与流行度相关的因素特征,利用融合后的特征训练回归模型,最后使用模型预测出未发布的帖子流行度的值。在社交媒体特征提取部分,目前大多数方法都是基于单模态的文本类型数据,忽视了图像和用户的特征数据以及同一用户不同帖子之间流行度的相关性,这种对社交媒体数据的不充分利用往往造成预测结果的片面性和不理想。在模型回归预测方面,当前大多数基于机器学习的流行度预测方法会采用平滑正则化项来避免过拟合,但是这种回归方法会导致预测结果的平滑化,即导致流行度的极值难以准确预测,然而在现实生活中,拥有较大流行度的帖子往往具有更大的价值,正确地预测这些极值是非常重要的。
发明内容
本发明的目的是提供一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,能够准确实现社交媒体流行度预测。
本发明的目的是通过以下技术方案实现的:
一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,包括:
对于包含多媒体特征的帖子,从中提取多模态特征,包括:图像特征、文本特征、类别概念特征、时序和空间特征、以及用户ID特征;
使用滑动窗口平均化策略来处理文本特征和图像特征,将平均后的文本特征和图像特征与其他特征融合;
将融合特征输入LightGBM模型,并通过分类器与回归器进行多次迭代优化,获得帖子的流行度预测结果。
由上述本发明提供的技术方案可以看出,为了解决多模态数据利用不充分的缺陷,从帖子中提取了多模态特征;为了增强特征的时效稳定性,使用滑动窗口中对帖子特征进行平均,再将通过滑动窗口平均后的融合特征矩阵利用LightGBM模型进行回归预测。为了解决流行度极值预测的难点,提出了一种迭代优化的策略,有效补偿了预测流行度分数的残差,特别是极值补偿。通过在SMPD2020数据集上进行的大量实验,取得了较好的效果,证明了本方法的有效性。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他附图。
图1为本发明实施例提供的一种基于迭代优化策略的多模态信息社交媒体流行度预测方法的流程图;
图2为本发明实施例提供的不同时间段的流行度分布示意图;
图3为本发明实施例提供的多模态特征提取与融合框架图;
图4为本发明实施例提供的基于LightGBM回归预测与迭代优化的框架。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科研究院;中国科学技术大学,未经北京中科研究院;中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010942007.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种耐磨鞋底材料及其制备方法
- 下一篇:一种农药残留检测系统