[发明专利]视频推荐的方法、装置、电子设备和存储介质在审
| 申请号: | 202110420279.9 | 申请日: | 2021-04-19 |
| 公开(公告)号: | CN113065027A | 公开(公告)日: | 2021-07-02 |
| 发明(设计)人: | 杜东;蔡慧慧 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F16/783 | 分类号: | G06F16/783;G06F16/9535;G06F40/194;G06F40/30;G06N20/00 |
| 代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 甄伟军 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 视频 推荐 方法 装置 电子设备 存储 介质 | ||
本申请提供一种视频推荐的方法、装置、电子设备和存储介质。该视频推荐的方法包括:获取待推荐视频的第一关联文本,其中,第一关联文本包括K个字符;对第一关联文本进行编码处理,得到第一编码序列,其中,第一编码序列包括K个概率值,概率值用于表示所对应的字符属于有效字符的概率;根据第一编码序列以及第一关联文本,生成第一文本表达向量;根据第一文本表达向量以及第二文本表达向量,确定句子相似度;若句子相似度大于推荐阈值,则向用户推荐待推荐视频。该方法避免由于无效字符而使得推荐结果与用于进行推荐的目标视频的内容差距过大,提升推荐的准确性以及用户体验。
技术领域
本申请涉及计算机技术领域,尤其涉及一种视频推荐的方法、装置、电子设备和存储介质。
背景技术
短视频是目前占用用户时长最久的应用形态之一。短视频应用的生态系统通常包含平台方、内容生产者以及内容消费者。短视频的推荐通常分为召回、粗排序、精排序以及混合排序等几个阶段。通过多种召回策略通过不同的排列组合方式最终在模型排序后展现给用户。
目前,短视频推荐通常基于视频内容的学习推荐方式,根据视频中内容将视频向量化表征,根据用户浏览过的视频的向量化表征来查找具有相似内容的视频来进行视频推荐。
然而,由于短视频的文本中包含的无意义内容经常具有较高的相似度,在推荐模型的学习和运行过程中,无意义内容的存在会导致视频之间的相似度升高,从而降低视频推荐的准确性。
发明内容
基于上述技术问题,本申请提供一种视频推荐的方法,以提升视频推荐的准确性以及用户体验。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供一种视频推荐的方法,包括:
获取待推荐视频的第一关联文本,其中,所述第一关联文本包括K个字符,所述K为大于或等于1的整数;
对所述第一关联文本进行编码处理,得到第一编码序列,其中,所述第一编码序列包括K个概率值,每个概率值对应于一个字符,所述概率值用于表示所对应的字符属于有效字符的概率;
根据所述第一编码序列以及所述第一关联文本,生成第一文本表达向量;
根据所述第一文本表达向量以及第二文本表达向量,确定句子相似度,其中,所述第二文本表达向量是根据历史视频的第二关联文本生成的,所述历史视频为用户浏览过的视频;
若所述句子相似度大于推荐阈值,则向所述用户推荐所述待推荐视频。
根据本申请实施例的一个方面,提供一种视频推荐装置,包括:
第一文本获取模块,用于获取待推荐视频的第一关联文本,其中,所述第一关联文本包括K个字符,所述K为大于或等于1的整数;
第一编码处理模块,用于对所述第一关联文本进行编码处理,得到第一编码序列,其中,所述第一编码序列包括K个概率值,每个概率值对应于一个字符,所述概率值用于表示元素所对应的字符属于有效字符的概率;
第一表达生成模块,用于根据所述第一编码序列以及所述第一关联文本,生成第一文本表达向量;
相似度模块,用于根据所述第一文本表达向量以及第二文本表达向量,确定句子相似度,其中,所述第二文本表达向量是根据历史视频的第二关联文本生成的,所述历史视频为用户浏览过的视频;
推荐模块,用于若所述句子相似度大于推荐阈值,则向所述用户推荐所述待推荐视频。
在本申请的一些实施例中,基于以上技术方案,第一编码处理模块包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110420279.9/2.html,转载请声明来源钻瓜专利网。





