[发明专利]基于特征动态构造的推荐模型训练方法及系统有效
| 申请号: | 202010122260.1 | 申请日: | 2020-02-27 |
| 公开(公告)号: | CN111340115B | 公开(公告)日: | 2023-05-12 |
| 发明(设计)人: | 张发恩;冯元;周鹏程;吴腾虎 | 申请(专利权)人: | 青岛创新奇智科技集团股份有限公司 |
| 主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F16/9535;G06F16/9538;G06Q30/0601 |
| 代理公司: | 深圳珠峰知识产权代理有限公司 44899 | 代理人: | 黄伟 |
| 地址: | 266217 山东省青岛市即墨区经*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 特征 动态 构造 推荐 模型 训练 方法 系统 | ||
1.一种基于特征动态构造的推荐模型训练方法,其特征在于,包括如下步骤:
步骤S1,对商品的类别型特征f0下的每个类别值进行价值判断,得到每个所述类别值对应的价值;
步骤S2,按照所述类别型特征f0下的每个所述类别值对应的所述价值高低进行类别值排序,并由价值从高到底筛选出模型训练所需数量的所述类别值;
步骤S3,基于所筛选的各所述类别值获取模型训练所需的训练样本,训练得到商品推荐模型;
所述步骤S1中,判断所述类别型特征f0下的每个所述类别值对应的所述价值的过程具体包括如下步骤:
步骤S11,获取n个带标签的样本,并以各所述样本的样本标签为序列元素,构成一长度为n的序列Y;n个所述样本中每个所述样本对应所述类别型特征f0的取值作为序列元素,构成一长度同样为n的序列Z;
步骤S12,依次选择所述类别型特征f0下的每个所述类别值,并根据所选择的所述类别值,对所述序列Z进行序列变换,得到经变换后分别对应各所述类别值的多个序列X;
步骤S13,计算每个所述序列X和所述序列Y的关联性,从而得到所述类别型特征f0下的每个所述类别值所具有的所述价值。
2.如权利要求1所述的推荐模型训练方法,其特征在于,所述步骤S13中,通过计算所述序列X和所述序列Y的皮尔森相关系数作为所选择的所述类别值具有的所述价值。
3.如权利要求1所述的推荐模型训练方法,其特征在于,所述步骤S13中,通过计算所述序列X和所述序列Y的KL散度,得到所选择的所述类别值具有的所述价值。
4.如权利要求1所述的推荐模型训练方法,其特征在于,所述样本的样本数据包括用户属性、用户行为数据、商品属性中的一种或多种。
5.一种基于特征动态构造的推荐模型训练系统,可实现如权1-4任意一项所述的方法,其特征在于,所述系统包括:
价值判断模块,用于判断所述商品的所述类别型特征f0下的每个所述类别值具有的所述价值;
数据筛选模块,连接所述价值判断模块,用于根据各所述类别值的所述价值由高到低筛选出模型训练所需的所述类别值;
模型训练模块,连接所述数据筛选模块,用于以筛选出的各所述类别值为训练样本,训练形成商品推荐模型。
6.如权利要求5所述的推荐模型训练系统,其特征在于,所述价值判断模块中具体包括:
样本获取单元,用于获取可评价所述类别值的所述价值的n个带标签样本;
序列形成单元,连接所述样本获取单元,用于以各所述样本的样本标签为序列元素,构成为一长度为n的序列Y;并用于以各所述样本分别对应所述类别型特征f0的取值为序列元素,同样构成为一长度为n的序列Z;
类别值读取单元,用于于类别值存储数据库中逐一读取所述类别型特征f0下的各所述类别值;
序列变换单元,分别连接所述类别值读取单元和所述序列形成单元,用于根据每次读取的所述类别值,对所述序列Z进行序列变换,得到经变换后的各所述类别值分别对应的序列X;
序列关联性计算单元,分别连接所述序列形成单元和所述序列变换单元,用于计算所述序列X和所述序列Y的关联性,以得到每个所述类别值所具有的所述价值并存储。
7.如权利要求6所述的推荐模型训练系统,其特征在于,通过计算所述序列X和所述序列Y的皮尔森相关系数作为读取的所述类别值具有的所述价值。
8.如权利要求6所述的推荐模型训练系统,其特征在于,通过计算所述序列X和所述序列Y的KL散度,得到读取的每个所述类别值具有的所述价值。
9.如权利要求5所述的推荐模型训练系统,其特征在于,所述数据筛选模块中具体包括:
类别值价值读取单元,用于读取所计算的每个所述类别值具有的所述价值;
价值排序单元,连接所述类别值价值读取单元,用于根据所述类别值的所述价值高低对所述类别值进行排序;
类别值筛选数量设置单元,用于提供给用户设置模型训练所需的所述类别值的筛选数量;
类别值筛选单元,分别连接所述价值排序单元和所述类别值筛选数量设置单元,用于根据所述用户设置的所述类别值的筛选数量,按照各所述类别值的所述价值由高到低从类别值存储数据库中筛选出模型训练所需的所述类别值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于青岛创新奇智科技集团股份有限公司,未经青岛创新奇智科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010122260.1/1.html,转载请声明来源钻瓜专利网。





