[发明专利]一种基于情感胶囊网络的短视频点击率预测方法有效

专利信息
申请号: 202010937121.4 申请日: 2020-09-08
公开(公告)号: CN112199550B 公开(公告)日: 2023-05-19
发明(设计)人: 吴健;顾盼;韩玉强;高维 申请(专利权)人: 浙江大学山东工业技术研究院
主分类号: G06F16/735 分类号: G06F16/735;G06F16/78;G06N3/048;G06N3/08
代理公司: 杭州橙知果专利代理事务所(特殊普通合伙) 33261 代理人: 贺龙萍
地址: 277000 山东省枣庄*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 情感 胶囊 网络 视频 点击率 预测 方法
【权利要求书】:

1.一种基于情感胶囊网络的短视频点击率预测方法,其特征在于包括以下步骤:

S1、将用户行为序列分割成块序列;

所述步骤S1还包括:

S11、用长度为w的窗口将一个用户的点击行为序列分割成m个块,每个块特征表征的计算方式如下:

其中,为用户在第k个块的偏好特征;

S12、采用相同的方式处理用户的负反馈信息,得到负反馈的块表征

S2、采用门机制从用户块序列和目标短视频中抽取模块特征,分别为用户块序列模块特征和目标短视频模块特征;

所述步骤S2的计算方法如下:

其中,代表第k块第i个模块特征,Wi,1和Wi,2是第i个模块的转移矩阵,是第i个模块的偏置向量,σ是sigmoid激活函数,⊙是元素级别的乘法,是点击序列中第k块的偏好特征,qi是第i个模块的表征且qi为所有用户共享;

所述步骤S2还包括:

S21、得到每个块的每个模块向量表征之后,采用平均池将所有的块中同一个模块信息聚合:

其中,m是块的个数,该公式从正反馈序列中得到M个模块特征

S22、采用相同的办法从负反馈序列中得到M个模块特征以及从目标短视频中得到M个模块特征

S3、利用情感胶囊网络获得用户对目标短视频的情感表征,通过胶囊网络从低层的模块特征抽取出情感特征,分析用户对短视频不同模块的情感来预测点击率,所述情感分为正面情感、负面情感和中立情感;

所述正面情感的数据来源于用户的正反馈序列,所述负面情感的数据来源于用户的负反馈序列,所述中立情感的数据来源于正反馈序列和负反馈序列的共同部分;

所述步骤S3还包括:

S31、把从用户序列抽取到的模块特征和目标短视频的模块特征一一配对,组合成激活单元:

其中,是目标短视频的第i个模块特征,是用户正反馈序列的第i个模块特征,⊙是元素维度的乘法,g是激活函数;

S32、采用相同的方法,得到负反馈序列的激活单元

S33、采用情感胶囊网络,从正反馈抽取出的激活单元中抽取情感特征:

其中,s∈{pos,neu},是正反馈序列的第i个激活单元到情感胶囊s的转换矩阵;正面情感胶囊vpos通过的加权和得到;是连接系数,代表的权重,参数采用动态路由算法更新;

所述激活函数g是胶囊网络中常用的向量激活函数:

其中,||·||代表向量的长度;

S34、采用情感胶囊网络,从负反馈抽取出的激活单元中抽取情感特征:

负面情感胶囊vneg等于:

其中,s∈{neg,neu};

S35、从正反馈和负反馈序列中抽取得到中立情感胶囊:

所述步骤S3还包括改进连接系数的更新方法,该方法包括:

S301、增加温度系数,增加温度系数改进动态路由系数公式如下:

其中,p∈{+,-}且s∈{pos,neg,neu};是输入胶囊i到输出胶囊s的连接系数且初始化为0;τ是温度系数;

S302、依据不同短视频模块的重要程度修正动态路由系数公式如下:

其中,是激活单元的长度,p∈{+,-}并且s∈{pos,neg,neu};

S4、根据情感特征,预测用户对目标短视频的点击率;

所述步骤S4还包括给定情感胶囊vs,计算用户点击目标短视频的概率为:

其中,s∈{pos,neg,neu},和是转移矩阵,是偏置向量,bs,2是偏置标量;σ是sigmoid激活函数,bu是用户维度的偏置,||vs||是向量的长度;

S5、根据模型特性,设计损失函数;

所述步骤S5包括如下步骤:

S51、通过用户对目标短视频的点击率预测值计算预测值和真实值y之间的误差,以使用误差来更新模型参数;采用交叉熵损失函数来指导模型参数的更新过程:

其中,y∈{0,1}是真实值,代表用户是否点击了目标短视频;σ是sigmoid函数;

S52、增加边缘损失函数Lstm和不一致损失函数Lasp作为正则项,损失函数为:

其中,λs和λa分别是损失函数Lstm和Lasp的正则参数;

所述步骤S52中,所述边缘损失函数Lstm计算公式如下:

其中,代表数据集中所有用户,短视频,∈和λ是模型参数;当真实值y=1时,vs=vpos;否则,vs=vneg;代表情感胶囊s的反面情感;

所述不一致正则项Lasp计算公式如下:

其中,M是模块向量q的个数;

S6、采用Adam优化器更新模型参数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学山东工业技术研究院,未经浙江大学山东工业技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010937121.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top