[发明专利]一种序列推荐模型的训练方法和对象推荐方法有效
| 申请号: | 202310396941.0 | 申请日: | 2023-04-14 |
| 公开(公告)号: | CN116151353B | 公开(公告)日: | 2023-07-18 |
| 发明(设计)人: | 王翔;杨正一;何向南 | 申请(专利权)人: | 中国科学技术大学 |
| 主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/048;G06N3/0442;G06N3/045;G06F16/9535;G06F16/735;G06Q30/0601 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 郭梦雅 |
| 地址: | 230026 安*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 序列 推荐 模型 训练 方法 对象 | ||
本发明提供了一种序列推荐模型的训练方法和对象推荐方法,其中,序列推荐模型包括经验学习模块和鲁棒学习模块,该训练方法包括:获取训练样本数据集;将训练样本数据集中的历史样本操作序列输入经验学习模块,输出第一预测结果,并根据第一预测结果和样本标签确定第一损失值;将历史样本操作序列输入鲁棒学习模块,输出第二预测结果,并根据第二预测结果、样本标签、预设的鲁棒半径和与历史样本操作序列对应的经验分布确定第二损失值;根据第一损失值和第二损失值确定总损失值;根据总损失值调整经验学习模块的网络参数以及鲁棒学习模块的网络参数,直至总损失值满足迭代条件;将总损失值满足迭代条件时得到的模型作为序列推荐模型。
技术领域
本发明涉及序列推荐技术领域,尤其涉及一种序列推荐模型的训练方法和对象推荐方法。
背景技术
序列推荐是根据用户在某一时间段内的浏览或者购买记录来对用户进行对象推荐的方法。序列推荐在推荐系统中占有重要的地位,它通过对用户的购买或浏览行为记录来建模,以此学习出用户的兴趣表示和变化,从而能够对用户的下一次操作进行预测和推荐。
相关技术中,一般采用历史数据对序列推荐系统进行训练,然后应用到实际推荐场景中进行预测和推荐。但是,实际推荐过程中的数据分布存在动态变化,导致采用历史数据训练得到的序列推荐系统在实际应用时存在推荐结果不准确的问题。
发明内容
针对上述技术问题,本发明提供了一种序列推荐模型的训练方法和对象推荐方法。
根据本发明的第一个方面,提供了一种序列推荐模型的训练方法,其中,上述序列推荐模型包括经验学习模块和鲁棒学习模块,上述训练方法包括:
获取训练样本数据集,其中,上述训练样本数据集包括至少一个训练样本,上述训练样本包括在第一时间段内生成的针对样本用户的历史样本操作序列和样本标签,上述样本标签表征上述样本用户在上述历史样本操作序列之后的下一个实际操作;
将上述历史样本操作序列输入上述经验学习模块,输出第一预测结果,并根据上述第一预测结果和上述样本标签确定第一损失值;
将上述历史样本操作序列输入上述鲁棒学习模块,输出第二预测结果,并根据上述第二预测结果、上述样本标签、预设的鲁棒半径和与上述历史样本操作序列对应的经验分布确定第二损失值,其中,上述经验分布表征上述历史样本操作序列中每个历史操作出现的频率;
根据上述第一损失值和上述第二损失值确定总损失值;
根据上述总损失值调整上述经验学习模块的网络参数以及上述鲁棒学习模块的网络参数,直至上述总损失值满足迭代条件;
将上述总损失值满足上述迭代条件时得到的模型作为序列推荐模型。
根据本发明的实施例,上述根据上述第一预测结果和上述样本标签确定第一损失值包括:
将上述第一预测结果和上述样本标签输入预设的经验风险最小化损失函数,得到上述第一损失值。
根据本发明的实施例,上述训练样本数据集中包括M个训练样本,其中,M≥2;
上述根据上述样本第二预测结果、上述样本标签、预设的鲁棒半径和与上述历史样本操作序列对应的经验分布确定第二损失值包括:
针对第i个训练样本,根据与第i个历史样本操作序列对应的第i个第二预测结果和第i个样本标签确定第i个风险值,最终得到M个风险值,i为正整数;
根据上述经验分布结合上述鲁棒半径,泛化得到测试分布,其中,上述测试分布包括测试样本数据,上述测试样本数据包括在上述鲁棒半径范围内的所有训练样本;
根据上述测试样本数据确定期望值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310396941.0/2.html,转载请声明来源钻瓜专利网。





