[发明专利]基于视频内容理解和用户动态兴趣的短视频推荐方法有效
| 申请号: | 201910131014.X | 申请日: | 2019-02-21 |
| 公开(公告)号: | CN109874053B | 公开(公告)日: | 2021-10-22 |
| 发明(设计)人: | 金莹莹;许娟;何鑫 | 申请(专利权)人: | 南京航空航天大学 |
| 主分类号: | H04N21/44 | 分类号: | H04N21/44;H04N21/45;H04N21/466 |
| 代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
| 地址: | 210007 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 视频 内容 理解 用户 动态 兴趣 推荐 方法 | ||
1.一种基于视频内容理解和用户动态兴趣的短视频推荐方法,其特征在于,包括步骤:
(1)利用深度学习技术提取短视频的多模态特征;
(2)利用PCA降维和数据标准化技术进行将视频特征与社交特征、用户特征进行融合得到深度融合特征;
(3)基于深度融合特征和观影记录,通过自我注意力机制和循环神经网络构建用户动态兴趣模型;
(4)基于用户动态兴趣模型和情景信息,采用多层感知机对候选短视频集实现视频内点击预测与推荐;
所述步骤(1)包括:
(1.1)提取短视频关键帧,利用深度学习技术提取视频的视觉特征;
(1.2)从视频中提取音频文件,并提取听觉特征;
所述步骤(1.1)包括:
a、利用深度卷积神经网络提取短视频的RGB特征,其具体步骤如下:
短视频的RGB特征提取;
利用预训练的ResNet模型对视频的RGB特征进行提取,ResNet中引入残差结构,解决神经网络中的退化问题,残差结构的计算公式:
其中,x代表网络结构的输入,代表卷积层/池化层操作后的输出,
所述残差结构是2层或3层输出后加上之前的输入x,
利用ResNet模型的最后一个全连接层的1000维的向量作为关键帧RGB特征表示,短视频的RGB特征最终由所有关键帧的RGB特征融合而得,融合公式:
其中,代表第i个关键帧的RGB特征,FR代表短视频的RGB特征;
b、利用C3D模型提取短视频的运动特征,其具体步骤如下:
用预训练的3D CNN模型对视频的运动特征进行提取,3D卷积的时间维度为3,即对连续的3帧图像进行卷积,通过堆叠多个连续的帧组成一个立方体,然后在立方体中运用3D卷积核,用3D CNN模型的最后一个全连接层的4096维的向量作为连续关键帧运动特征表示,短视频的运动特征最终由所有连续关键帧的运动特征融合而得,融合公式如下:
其中,代表第i个连续关键帧的运动特征,FS代表短视频的运动特征,
(1.2)短视频的音频特征提取;
首先将音频文件从视频中分离出,再对其进行融合,融合公式如下:
FA=concat([FMFCC,FZCR,……])
其中,FMFCC代表梅尔频率倒谱系数的特征表示,FZCR代表过零率的特征表示,省略了其他22个音频特征的表达形式,FA代表短视频的听觉特征。
2.根据权利要求1所述的基于视频内容理解和用户动态兴趣的短视频推荐方法,其特征在于,所述步骤(2)具体地,先利用PCA对各个特征进行降维,在保留99%以上的信息,同时减小特征维度;再利用数据标准化,将不同特征映射到同一语义空间中;最后进行拼接融合。
3.根据权利要求1所述的基于视频内容理解和用户动态兴趣的短视频推荐方法,其特征在于,所述步骤(3)中用户动态兴趣模型包括兴趣提取层和兴趣演化层:
(3.1)兴趣提取层利用自我注意力机制进行兴趣提取,学习历史行为之间的影响;
(3.2)兴趣演化层利用循环神经网络和注意力机制,对每个候选短视频的兴趣演化过程进行学习。
4.根据权利要求1所述的基于视频内容理解和用户动态兴趣的短视频推荐方法,其特征在于,所述步骤(4)具体地,采用多层感知机,判断用户是否对该视频感兴趣,从而完成视频内容点击预测;将候选视频集按照预测点击率排序,将预测点击率高的视频推荐给该用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910131014.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:图像处理方法、装置、设备及系统
- 下一篇:一种广告推荐方法及装置
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法





