[发明专利]基于特征动态构造的推荐模型训练方法及系统有效

专利信息
申请号: 202010122260.1 申请日: 2020-02-27
公开(公告)号: CN111340115B 公开(公告)日: 2023-05-12
发明(设计)人: 张发恩;冯元;周鹏程;吴腾虎 申请(专利权)人: 青岛创新奇智科技集团股份有限公司
主分类号: G06F18/214 分类号: G06F18/214;G06F16/9535;G06F16/9538;G06Q30/0601
代理公司: 深圳珠峰知识产权代理有限公司 44899 代理人: 黄伟
地址: 266217 山东省青岛市即墨区经*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 特征 动态 构造 推荐 模型 训练 方法 系统
【说明书】:

发明公开了一种基于特征动态构造的推荐模型训练方法及系统,其中方法包括:步骤S1,对商品的类别型特征f0下的每个类别值进行价值判断,得到每个类别值对应的价值;步骤S2,按照类别型特征f0下的每个类别值对应的价值高低进行类别值排序,并由价值从高到底筛选出模型训练所需数量的类别值;步骤S3,基于筛选的各类别值获取模型训练所需的训练样本,训练得到商品推荐模型。本发明可及时捕捉到类别型特征下的各类别值的价值变化趋势,及时对类别值进行更新和过滤,并以更新后的数据为训练样本迭代训练推荐模型,可大幅提高推荐模型的性能。

技术领域

本发明涉及机器学习技术领域,具体涉及一种基于特征动态构造的推荐模型训练方法及系统。

背景技术

为了提高用户的线上购物体检,并更有针对性地将商品推荐给合适的用户,目前各大线上电商平台普遍采用机器学习的商品推荐模型分析用户的购物习惯、购物偏好等用户行为数据,然后基于这些用户行为数据将各种商品更有针对性地推荐给用户。训练商品推荐模型通常以类别型特征和统计特征为训练样本,当前在商品推荐模型的训练过程中,对于类别型特征和基于类别型特征的统计特征的使用方式简述如下:

例如对于商品的品牌特征这个类别型特征,通过独热编码操作将不同的品牌映射成不同的数字,在完成对品牌的独热编码操作后,就可以基于用户的行为数据生成一些统计数据,比如某用户在最近一个月内对某品牌发生了多少次浏览行为、购买行为等,这些统计数据在经过归一化、标准化等数据处理后,与类别型特征一并作为训练样本以训练商品推荐模型。但是,一个类别型特征的特征数量往往庞大,如果对一个类别型特征比如品牌特征进行全部独热操作,维度极高,模型训练的速度很慢,所以为了提高模型的训练速度,往往会选取其中一部分品牌进行单独的独热操作,其余的品牌总体作为一个类别,通常为“other”。但这样的处理方式存在一个问题,模型在迭代训练过程中,被选中进行独热操作的这些类别通常是固定不变的,这会导致:

(1)类别型特征下的新的有价值的类别值(比如品牌类别中的某一品牌)无法及时作为模型迭代训练的训练样本,造成迭代形成的模型性能无法得到有效提升;

(2)无法捕捉到历史类别值的价值变化,过去有价值有意义的某个类别值,随着时间推移可能已经不再发挥那么大的作用了,所以在模型迭代训练过程中,需要过滤掉这些价值较低的类别值,以提高模型的商品推荐性能,但现有的模型训练方法无法及时过滤这些价值较低的类别值。

发明内容

本发明的目的在于提供一种基于特征动态构造的推荐模型训练方法及系统,以解决上述技术问题。

为达此目的,本发明采用以下技术方案:

提供一种基于特征动态构造的推荐模型训练方法,包括如下步骤:

步骤S1,对商品的类别型特征f0下的每个类别值进行价值判断,得到每个所述类别值对应的价值;

步骤S2,按照所述类别型特征f0下的每个所述类别值对应的所述价值高低进行类别值排序,并由价值从高到底筛选出模型训练所需数量的所述类别值;

步骤S3,基于所筛选的各所述类别值获取模型训练所需的训练样本,训练得到商品推荐模型。

作为本发明的一种优选方案,所述步骤S1中,判断所述类别型特征f0下的每个所述类别值对应的所述价值的过程具体包括如下步骤:

步骤S11,获取n个带标签的样本,并以各所述样本的样本标签为序列元素,构成一长度为n的序列Y;n个所述样本中每个所述样本对应所述类别型特征f0的取值作为序列元素,构成一长度同样为n的序列Z;

步骤S12,依次选择所述类别型特征f0下的每个所述类别值,并根据所选择的所述类别值,对所述序列Z进行序列变换,得到经变换后分别对应各所述类别值的多个序列X;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛创新奇智科技集团股份有限公司,未经青岛创新奇智科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010122260.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top