[发明专利]一种短视频推荐方法有效
| 申请号: | 202110710623.8 | 申请日: | 2021-06-25 |
| 公开(公告)号: | CN113268633B | 公开(公告)日: | 2022-11-11 |
| 发明(设计)人: | 徐童;王纯;李炜;王玉龙;刘端阳;刘同存;王晶 | 申请(专利权)人: | 北京邮电大学 |
| 主分类号: | G06F16/735 | 分类号: | G06F16/735;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100876 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 视频 推荐 方法 | ||
1.一种短视频推荐方法,其特征在于,包括有:
步骤一、获取用户对短视频的历史行为数据,所述用户历史行为数据包括有:用户历史点击短视频的id、类别id、作者id、封面图片、音乐、原时长、播放时长、点击时间戳、用户属性特征;
步骤二、选取若干位样本用户,根据样本用户对短视频的历史点击行为,构建每位样本用户的短视频点击序列,并从中选定样本用户的目标短视频和历史点击序列,计算每位样本用户对其目标短视频的观看深度,所述观看深度即用户对短视频的播放时长和短视频原时长的比值,然后由样本用户的目标短视频、历史点击序列、用户属性特征、对目标短视频的观看深度构成每条样本用户数据,并写入样本数据集中,所述历史点击序列进一步包括有:历史点击短视频id序列、历史点击短视频类别id序列、历史点击短视频作者id序列、历史点击短视频封面图片序列、历史点击短视频音乐序列;
步骤三、构建短视频推荐模型,并以样本数据集中的每条样本用户数据进行训练,短视频推荐模型对每条样本用户数据的处理过程如下:构建用于表征所有短视频id、短视频类别id和短视频作者id特征的嵌入式向量映射表,然后基于短视频的id、类别id、作者id的嵌入式向量和其封面图片对应的封面特征向量、音乐对应的音频特征向量,为用户的目标短视频和历史点击序列中的每条历史点击短视频构建相应的嵌入式向量,并根据每个历史点击短视频的嵌入式向量计算用户历史兴趣向量,再根据所有历史点击短视频的用户历史兴趣向量和目标短视频的嵌入式向量计算用户兴趣向量,最后根据目标短视频的嵌入式向量和用户兴趣向量计算输出用户对目标短视频的点击率;
步骤四、获取待推荐用户的历史点击序列,并将待推荐短视频作为待推荐用户的目标短视频,然后将待推荐用户的目标短视频、历史点击序列、用户属性特征输入至训练好的短视频推荐模型,并依据模型计算输出的用户对目标短视频的点击率以确定是否向用户推荐短视频,
步骤三中,短视频推荐模型对每条样本用户数据的处理过程进一步包括有:
步骤31、采用VGGNet网络,将样本用户数据中的目标短视频的封面图片和历史点击短视频封面图片序列中的所有历史点击短视频的封面图片分别转化成封面特征向量,然后由历史点击短视频封面图片序列中的所有封面图片转化后的封面特征向量构成历史点击短视频封面特征向量序列;
步骤32、将样本用户数据的目标短视频的音乐和历史点击短视频音乐序列中的所有历史点击短视频的音乐分别转化成音频特征向量,然后由历史点击短视频音乐序列中的所有音乐转化后的音频特征向量构成历史点击短视频音频特征向量序列,其中,将目标短视频的音乐或者历史点击短视频音乐序列中的任一历史点击短视频的音乐转化成音频特征向量的过程具体如下:先对短视频音乐的音频采样若干帧,利用MFCC技术提取每帧采样音频的音频特征向量,然后通过一个自注意力网络对所有采样音频的音频特征向量进行重新映射以获得每个采样音频对应的中间向量,最后将所有采样音频的中间向量通过一个全连接层,并对全连接层的输出进行平均池化,池化后的输出向量即是短视频音乐转化后的音频特征向量;
步骤33、为短视频id、短视频类别id、短视频作者id分别构建嵌入式向量映射表,然后从嵌入式向量映射表中查询获得样本用户的目标短视频和历史点击序列中每个历史点击短视频的id、类别id、作者id的嵌入式向量,最后通过concat操作,构建目标短视频和每个历史点击短视频的嵌入式向量,即将短视频的id的嵌入式向量、类别id的嵌入式向量、作者id的嵌入式向量、封面特征向量、音频特征向量合并成一个嵌入式向量,并由所有历史点击短视频的嵌入式向量构成历史点击短视频嵌入式向量序列;
步骤34、将历史点击短视频嵌入式向量序列中的所有历史点击短视频的嵌入式向量输入一个自注意力网络和一个全连接层,从而输出获得每个历史点击短视频的用户历史兴趣向量,并由所有历史点击短视频的用户历史兴趣向量构成用户历史兴趣向量序列;
步骤35、依次将用户历史兴趣向量序列中的每个历史点击短视频的用户历史兴趣向量和目标短视频的嵌入式向量的和、差、积拼接成一个输入向量,然后将输入向量输入至一个多层感知机MLP,MLP的输出即是每个历史点击短视频的兴趣权重,最后将MLP输出的所有历史点击短视频的兴趣权重通过softmax函数进行归一化计算,并根据归一化后的所有历史点击短视频的兴趣权重,计算获得用户兴趣向量:其中,iT是用户兴趣向量,it是第t个短视频的用户历史兴趣向量,wt是归一化后的第t个短视频的兴趣权重,T是用户历史兴趣向量序列中的所有历史点击短视频数;
步骤36、通过concat操作,将用户兴趣向量iT和目标短视频的嵌入式向量eT拼接成一个向量Z,然后通过一个多层感知机,计算样本用户对目标短视频的点击率O:O=sigmoid(MLP(Z)),其中,MLP(Z)表示将向量Z输入多层感知机MLP后的输出值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110710623.8/1.html,转载请声明来源钻瓜专利网。





