[发明专利]一种基于情感胶囊网络的短视频点击率预测方法有效
申请号: | 202010937121.4 | 申请日: | 2020-09-08 |
公开(公告)号: | CN112199550B | 公开(公告)日: | 2023-05-19 |
发明(设计)人: | 吴健;顾盼;韩玉强;高维 | 申请(专利权)人: | 浙江大学山东工业技术研究院 |
主分类号: | G06F16/735 | 分类号: | G06F16/735;G06F16/78;G06N3/048;G06N3/08 |
代理公司: | 杭州橙知果专利代理事务所(特殊普通合伙) 33261 | 代理人: | 贺龙萍 |
地址: | 277000 山东省枣庄*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 情感 胶囊 网络 视频 点击率 预测 方法 | ||
1.一种基于情感胶囊网络的短视频点击率预测方法,其特征在于包括以下步骤:
S1、将用户行为序列分割成块序列;
所述步骤S1还包括:
S11、用长度为w的窗口将一个用户的点击行为序列分割成m个块,每个块特征表征的计算方式如下:
其中,为用户在第k个块的偏好特征;
S12、采用相同的方式处理用户的负反馈信息,得到负反馈的块表征
S2、采用门机制从用户块序列和目标短视频中抽取模块特征,分别为用户块序列模块特征和目标短视频模块特征;
所述步骤S2的计算方法如下:
其中,代表第k块第i个模块特征,Wi,1和Wi,2是第i个模块的转移矩阵,是第i个模块的偏置向量,σ是sigmoid激活函数,⊙是元素级别的乘法,是点击序列中第k块的偏好特征,qi是第i个模块的表征且qi为所有用户共享;
所述步骤S2还包括:
S21、得到每个块的每个模块向量表征之后,采用平均池将所有的块中同一个模块信息聚合:
其中,m是块的个数,该公式从正反馈序列中得到M个模块特征
S22、采用相同的办法从负反馈序列中得到M个模块特征以及从目标短视频中得到M个模块特征
S3、利用情感胶囊网络获得用户对目标短视频的情感表征,通过胶囊网络从低层的模块特征抽取出情感特征,分析用户对短视频不同模块的情感来预测点击率,所述情感分为正面情感、负面情感和中立情感;
所述正面情感的数据来源于用户的正反馈序列,所述负面情感的数据来源于用户的负反馈序列,所述中立情感的数据来源于正反馈序列和负反馈序列的共同部分;
所述步骤S3还包括:
S31、把从用户序列抽取到的模块特征和目标短视频的模块特征一一配对,组合成激活单元:
其中,是目标短视频的第i个模块特征,是用户正反馈序列的第i个模块特征,⊙是元素维度的乘法,g是激活函数;
S32、采用相同的方法,得到负反馈序列的激活单元
S33、采用情感胶囊网络,从正反馈抽取出的激活单元中抽取情感特征:
其中,s∈{pos,neu},是正反馈序列的第i个激活单元到情感胶囊s的转换矩阵;正面情感胶囊vpos通过的加权和得到;是连接系数,代表的权重,参数采用动态路由算法更新;
所述激活函数g是胶囊网络中常用的向量激活函数:
其中,||·||代表向量的长度;
S34、采用情感胶囊网络,从负反馈抽取出的激活单元中抽取情感特征:
负面情感胶囊vneg等于:
其中,s∈{neg,neu};
S35、从正反馈和负反馈序列中抽取得到中立情感胶囊:
所述步骤S3还包括改进连接系数的更新方法,该方法包括:
S301、增加温度系数,增加温度系数改进动态路由系数公式如下:
其中,p∈{+,-}且s∈{pos,neg,neu};是输入胶囊i到输出胶囊s的连接系数且初始化为0;τ是温度系数;
S302、依据不同短视频模块的重要程度修正动态路由系数公式如下:
其中,是激活单元的长度,p∈{+,-}并且s∈{pos,neg,neu};
S4、根据情感特征,预测用户对目标短视频的点击率;
所述步骤S4还包括给定情感胶囊vs,计算用户点击目标短视频的概率为:
其中,s∈{pos,neg,neu},和是转移矩阵,是偏置向量,bs,2是偏置标量;σ是sigmoid激活函数,bu是用户维度的偏置,||vs||是向量的长度;
S5、根据模型特性,设计损失函数;
所述步骤S5包括如下步骤:
S51、通过用户对目标短视频的点击率预测值计算预测值和真实值y之间的误差,以使用误差来更新模型参数;采用交叉熵损失函数来指导模型参数的更新过程:
其中,y∈{0,1}是真实值,代表用户是否点击了目标短视频;σ是sigmoid函数;
S52、增加边缘损失函数Lstm和不一致损失函数Lasp作为正则项,损失函数为:
其中,λs和λa分别是损失函数Lstm和Lasp的正则参数;
所述步骤S52中,所述边缘损失函数Lstm计算公式如下:
其中,代表数据集中所有用户,短视频,∈和λ是模型参数;当真实值y=1时,vs=vpos;否则,vs=vneg;代表情感胶囊s的反面情感;
所述不一致正则项Lasp计算公式如下:
其中,M是模块向量q的个数;
S6、采用Adam优化器更新模型参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学山东工业技术研究院,未经浙江大学山东工业技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010937121.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种入侵检测方法
- 下一篇:一种湿地软质土壤施工用加固桩及安装方法