[发明专利]一种对象推荐网络的训练方法、装置、设备及存储介质在审
| 申请号: | 201910748285.X | 申请日: | 2019-08-13 |
| 公开(公告)号: | CN110442804A | 公开(公告)日: | 2019-11-12 |
| 发明(设计)人: | 余献文;张晓宁 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
| 主分类号: | G06F16/9536 | 分类号: | G06F16/9536;G06N3/08 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
| 地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 编码结果 对象关联 对象推荐 重构 存储介质 判别结果 网络 编码处理 解码处理 网络参数 判别器 申请 | ||
本申请公开了一种对象推荐网络的训练方法、装置、设备及存储介质,其中方法包括:对初始用户‑对象关联数据进行编码处理,得到编码结果;对编码结果进行解码处理,得到重构用户‑对象关联数据;基于重构用户‑对象关联数据与初始用户‑对象关联数据之间的差异,得到重构损失;通过第一判别器对初始用户‑对象关联数据和编码结果进行判别,得到第一判别结果,并将第一判别结果作为第一判别损失;基于第一判别损失和重构损失,调整对象推荐网络的网络参数。本申请通过利用重构损失以及第一判别损失来调整对象推荐网络的参数,来尽可能的减少对象推荐网络对编码结果的约束,从而提高编码结果的表现力。
技术领域
本申请涉及协同过滤领域,尤其涉及一种对象推荐网络的训练方法、装置、设备及存储介质。
背景技术
对象推荐网络作为解决信息超载的一个非常有潜力的方法,它能够根据用户的信息需求和兴趣给他们推荐个性化信息和产品。而协同过滤技术是推荐系统中最早也是最成功的技术之一。
在众多协同过滤技术中,基于编码-解码的协同过滤技术取得了比较好的效果。基于编码-解码的协同过滤技术的原理是先对原始用户数据进行编码得到用于表示原始用户数据的数据分布的编码结果,然后对该编码结果进行解码,即根据该编码结果重构新用户数据。新用户数据相对于原始用户数据来说,预测出了用户与待推荐物品之间的关联关系,因此基于该新用户数据可以对用户进行推荐。但在实际应用中,基于编码-解码的协同过滤技术的推荐性能并不理想。
发明内容
本申请实施例提供一种对象推荐网络的训练方法,可以通过对对象推荐网络进行训练,来提高对象推荐网络的推荐性能。
第一方面,本申请实施例提供了一种对象推荐网络的训练方法,该方法包括:
对初始用户-对象关联数据进行编码处理,得到编码结果;
对所述编码结果进行解码处理,得到重构用户-对象关联数据;
基于所述重构用户-对象关联数据与所述初始用户-对象关联数据之间的差异,得到重构损失;
通过第一判别器对所述初始用户-对象关联数据和所述编码结果进行判别,得到第一判别结果,并将所述第一判别结果作为第一判别损失;
基于所述第一判别损失和所述重构损失,调整所述对象推荐网络的网络参数。
结合第一方面,在第一方面的第一种实现中,所述基于所述第一判别损失和所述重构损失,调整所述对象推荐网络的网络参数,包括:
将约束强度参数作为所述第一判别损失的权重,对所述重构损失和所述第一判别损失进行加权求和,得到网络损失,其中,所述约束强度参数为大于或等于0且小于1的数值;
基于所述网络损失,调整所述对象推荐网络的网络参数。
结合第一方面的第一种实现,在第一方面的第二种实现中,所述约束强度参数在所述训练中的初始值为0,且数值随着迭代次数的增加而增大,直到到达预设阈值,其中,所述预设阈值为大于0且小于1的数值。
结合第一方面至第一方面的第二种实现,在第一方面的第三种实现中,所述方法还包括:
基于所述编码结果对所述初始用户-对象关联数据求导,得到收缩损失;
所述基于所述第一判别损失和所述重构损失,调整所述对象推荐网络的网络参数,包括:
基于所述第一判别损失、所述重构损失和所述收缩损失,调整所述对象推荐网络的网络参数。
结合第一方面第三种实现,在第一方面的第四种实现中,所述基于所述第一判别损失、所述重构损失和所述收缩损失,调整所述对象推荐网络的网络参数,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910748285.X/2.html,转载请声明来源钻瓜专利网。





