[发明专利]推荐模型的训练方法、装置、电子设备及存储介质在审
申请号: | 202111002586.1 | 申请日: | 2021-08-30 |
公开(公告)号: | CN113705683A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 骆明楠;廖一桥;刘成军 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/9535 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 赵祎 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 推荐 模型 训练 方法 装置 电子设备 存储 介质 | ||
本公开公开了一种推荐模型的训练方法、装置、电子设备及存储介质。该方法在获取训练样本集后确定待处理训练样本集;遍历待处理训练样本集,并执行:根据当前训练样本中第一对象类型对应的样本信息,在第一训练样本中确定当前训练样本的相似样本;将相似样本中的第二对象类型对应的样本信息,对当前训练样本中的第二对象类型对应的样本信息进行替换,将替换后的当前训练样本作为新训练样本,以及得到新训练样本的样本标签;基于训练样本集中的训练样本和相应样本标签,以及待处理训练样本集中每个训练样本对应的新训练样本和相应样本标签,对神经网络模型进行迭代训练,得到推荐模型。该方法提高了推荐模型的推荐准确率。
技术领域
本公开涉及数据处理技术领域,尤其涉及一种推荐模型的训练方法、装置、 电子设备及存储介质。
背景技术
对于多媒体的推荐系统,输入推荐系统的样本信息可以包括用户账户信息 和多媒体资源信息,还可以包括用户账户与相应多媒体资源的上下文信息,获 取到该样本信息中每种属性的特征向量,如词向量后,推荐系统通过这些词向 量,可以判断出该样本信息属于正样本的概率值(即基于这样的上下文信息的 情况下,该用户选择该对象的概率值)。
在训练推荐模型时,常常存在因训练样本少,导致训练出的推荐模型的推 荐准确性不高的问题。
发明内容
本公开实施例提供一种推荐模型的训练方法、装置、电子设备及存储介质, 以至少解决相关技术中因训练样本少,导致训练出的推荐模型的推荐准确率不 高的问题。本公开的技术方案如下:
根据本公开实施例的第一方面,提供一种推荐模型的训练方法,该方法可 以包括:
获取训练样本集,所述训练样本集包括训练样本和所述训练样本对应的样 本标签;所述训练样本包括两种对象类型对应的样本信息,所述两种对象类型 包括账户类型和多媒体类型,所述两种对象类型对应的样本信息包括用户账户 信息和多媒体资源信息;所述样本标签表征所述用户账户信息对应的账户对所 述多媒体资源信息对应的多媒体资源间的操作行为;
确定所述训练样本集中的待处理训练样本集;遍历所述待处理训练样本集, 针对遍历到的当前训练样本,执行如下步骤:
根据所述当前训练样本中第一对象类型对应的样本信息,在第一训练 样本中确定所述当前训练样本的相似样本;其中,所述第一对象类型是所 述训练样本中的一种对象类型;所述第一训练样本为所述训练样本集中除 所述当前训练样本外的其他训练样本;
将所述相似样本中的第二对象类型对应的样本信息,对所述当前训练 样本中的第二对象类型对应的样本信息进行替换,将替换后的所述当前训 练样本作为新训练样本,并将相应相似样本的样本标签确定为所述新训练 样本的样本标签;所述第二对象类型是所述训练样本中除所述第一对象类 型外的类型;
基于所述训练样本集中的训练样本和相应样本标签,以及所述待处理训练 样本集中每个训练样本对应的新训练样本和相应样本标签,对神经网络模型进 行迭代训练,得到推荐模型。
该实施方式通过对用户账户对应的训练样本或多媒体资源对应的训练样 本进行样本扩展,得到针对相应用户账户或多媒体资源的新训练样本,从而避 免某些用户账户或某些多媒体资源对应样本因有效样本少,而导致训练出的推 荐模型不准确的问题,提高了推荐模型的推荐准确率。
一种可能的实施方式中,所述用户账户信息包括账户标识;
在所述第一对象类型对应的样本信息为所述用户账户信息时,确定所述训 练样本集中的待处理训练样本集,包括:
获取历史累计样本中各账户标识的数量;
若目标账户标识的数量小于预设数量阈值,则将所述训练样本集中所述目 标账户标识对应的训练样本确定为待处理训练样本,基于确定的待处理训练样 本构建待处理训练样本集;所述目标账户标识为所述训练样本集中的一个账户 标识。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111002586.1/2.html,转载请声明来源钻瓜专利网。