[发明专利]基于迭代优化策略的多模态信息社交媒体流行度预测方法有效
申请号: | 202010942007.0 | 申请日: | 2020-09-09 |
公开(公告)号: | CN111984872B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 毛震东;张勇东;黄梦琪 | 申请(专利权)人: | 北京中科研究院;中国科学技术大学 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F16/9536;G06F16/432;G06F16/435 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;韩珂 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 优化 策略 多模态 信息 社交 媒体 流行 预测 方法 | ||
1.一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,其特征在于,包括:
对于包含多媒体特征的帖子,从中提取多模态特征,包括:图像特征、文本特征、类别概念特征、时序和空间特征、以及用户ID特征;
使用滑动窗口平均化策略来处理文本特征和图像特征,将平均后的文本特征和图像特征与其他特征融合;
将融合特征输入LightGBM模型,并通过分类器与回归器进行多次迭代优化,获得帖子的流行度预测结果;
其中,将融合特征输入LightGBM模型,并通过分类器与回归器进行多次迭代优化的过程包括:
将平均后的融合特征输入至LightGBM模型,能够初步的得到流行度预测结果;在训练阶段,基于流行度预测结果与真实值的残差进行补偿;
将初步的得到流行度预测结果记为Ps,将Ps与真实值的残差记为R;通过训练一个二值分类器来区分具有不同流行度的训练样本,二值分类器表示为:
g(Xs)=C(Xs,|θs)
其中,Xs为训练集,C(.)为使用的分类器模型,θs为分类器模型的参数,g(Xs)为-1代表非极值,g(Xs)为1代表极值;
二值分类器训练中的损失函数为:
其中,N代表训练样本总数,l是由学习方法定义的损失函数,L是总损失函数;Rt为二值类的残差,定义方式为:预先定义一个阈值ty,根据流行度预测结果和真实值的残差R是否大于该阈值ty将该流行度的残差R分为两类:一类大于阈值,一类小于阈值,由此将原先的非二值类的R转换为二值类Rt;
设gj表示第j次迭代时的二值分类器,则gj(Xs)=1时需要进行补偿;设计多级回归来补偿每次预测的残差;设hj表示第j个回归器,需要学习k个回归器和二值分类器;第j次迭代时回归器和二值分类器的训练,基于第j次迭代的二值类残差和第j次迭代根据阈值ty挑选出来的训练样本实现;第j次迭代的补偿函数定义如下:
上式中,Rj为第j次迭代的残差,用来确定二值类残差为第j-1次迭代的补偿值,θj、θj-1分别为第j次、第j-1次迭代回归器的参数,hj-1为第j-1次迭代的回归器;
训练样本满足:通过控制阈值ty从而确定训练样本的数量来补偿预测结果;设ty=0,则对所有预测结果进行残差补偿。
2.根据权利要求1所述的一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,其特征在于,通过预训练的Show Attention and Tell模型生成图像的文本描述,再将文本描述编码与解码,得到图像特征。
3.根据权利要求1所述的一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,其特征在于,通过对文字数据进行清洗与去噪处理,再利用预训练的深度学习模型Bert提取出文本特征;同时,还统计每条帖子中文本的单词数与字符数。
4.根据权利要求1所述的一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,其特征在于,通过预训练的Glove来提取帖子概念的单词表示,作为类别概念特征。
5.根据权利要求1所述的一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,其特征在于,将帖子的时间转换为北京时间,再按照划分的时间尺度,从转换的北京时间中提取时间特征的统计信息,再结合帖子的发布位置,构成时序和空间特征。
6.根据权利要求1所述的一种基于迭代优化策略的多模态信息社交媒体流行度预测方法,其特征在于,将用户ID表示为一个独热向量,并利用tsvd算法进行降维处理,再结合用户的粉丝数和用户的发帖数,构成用户ID特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中科研究院;中国科学技术大学,未经北京中科研究院;中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010942007.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种耐磨鞋底材料及其制备方法
- 下一篇:一种农药残留检测系统