[发明专利]多媒体文件推荐方法、装置、电子设备及可读存储介质在审
申请号: | 202110336117.7 | 申请日: | 2021-03-29 |
公开(公告)号: | CN113032589A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 查强 | 申请(专利权)人: | 北京奇艺世纪科技有限公司 |
主分类号: | G06F16/435 | 分类号: | G06F16/435;G06F16/48;G06F16/33 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 高莺然;马敬 |
地址: | 100080 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多媒体 文件 推荐 方法 装置 电子设备 可读 存储 介质 | ||
1.一种多媒体文件推荐方法,其特征在于,包括:
获取待推荐用户的历史访问记录,所述历史访问记录为所述待推荐用户在指定时间段内访问过的多媒体文件;
基于所述历史访问记录包括的多媒体文件,生成所述待推荐用户的历史访问标签集合;
获取每个待推荐多媒体文件的标签集合;
基于预设深度语义匹配模型,确定所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度;其中,所述预设深度语义匹配模型为基于样本训练集对初始深度语义匹配模型训练得到的模型,所述样本训练集包括每个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合;针对每个样本用户,该样本用户的样本历史访问标签集合包括:该样本用户在历史时间段内访问过的多媒体文件对应的标签;该样本用户的正样本标签集合包括:该样本用户最近一次访问的多媒体文件对应的标签;该样本用户的负样本标签集合包括:预设数量的其他样本用户在所述历史时间段内访问过的多媒体文件对应的标签;
根据所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度,选择为所述待推荐用户推荐的待推荐文件。
2.根据权利要求1所述的方法,其特征在于,所述预设深度语义匹配模型通过以下步骤训练获得:
构建所述样本训练集;
将所述样本训练集包括的一个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合输入所述初始深度语义匹配模型,获取所述初始深度语义模型输出的第一相似度和第二相似度,所述第一相似度为样本用户的样本历史访问标签集合与正样本标签集合之间的语义相似度,所述第二相似度为样本用户的样本历史访问标签集合与负样本标签之间的语义相似度;
基于所述第一相似度和所述第二相似度计算损失函数值,根据所述损失函数值,判断所述初始深度语义匹配模型是否收敛;
如果所述初始深度语义匹配模型未收敛,则根据所述损失函数值调整所述初始深度语义匹配模型的网络参数,并返回将所述样本训练集包括的一个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合输入所述初始深度语义匹配模型的步骤;
如果所述初始深度语义匹配模型收敛,则将当前的初始深度语义匹配模型作为所述预设深度语义匹配模型。
3.根据权利要求2所述的方法,其特征在于,所述构建所述样本训练集,包括:
针对每个样本用户,获取该样本用户在所述历史时间段内访问过的多媒体文件;
对获取到的多媒体文件的属性信息进行分词,得到该样本用户的样本历史访问标签集合;
对该样本用户最近一次访问的多媒体文件的属性信息进行分词,得到该样本用户的正样本标签集合;
对所有样本用户中,除该样本用户之外的其他样本用户进行随机负采样,获取预设数量的其他样本用户的样本历史访问标签集合,作为该样本用户的负样本标签集合;
将多个样本用户的样本历史访问标签集合、正样本标签集合和负样本标签集合构建为所述样本训练集。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述基于预设深度语义匹配模型,确定所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度,包括:
针对每个待推荐多媒体文件,将该待推荐多媒体文件的标签集合和所述待推荐用户的历史访问标签集合输入所述预设深度语义匹配模型,获取所述预设深度语义匹配模型输出的该待推荐多媒体文件的标签集合对应的语义向量与所述历史访问标签集合对应的语义向量之间的相似度。
5.根据权利要求1-3任一项所述的方法,其特征在于,所述基于预设深度语义匹配模型,确定所述历史访问标签集合对应的语义向量与每个待推荐多媒体文件的标签集合对应的语义向量之间的相似度,包括:
针对每个待推荐多媒体文件,将该多媒体文件的标签集合和所述待推荐用户的历史访问标签集合输入所述预设深度语义模型,获取所述预设深度语义匹配模型输出的该待推荐多媒体文件的标签集合对应的第一语义向量,以及所述历史访问标签集合对应的第二语义向量;基于预设相似度算法,计算所述第一语义向量与所述第二语义向量之间的相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇艺世纪科技有限公司,未经北京奇艺世纪科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110336117.7/1.html,转载请声明来源钻瓜专利网。