[发明专利]一种模型特征剔除方法及装置有效
| 申请号: | 201811636726.9 | 申请日: | 2018-12-29 |
| 公开(公告)号: | CN110046711B | 公开(公告)日: | 2023-08-04 |
| 发明(设计)人: | 岳赟 | 申请(专利权)人: | 创新先进技术有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00 |
| 代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 林祥 |
| 地址: | 开曼群岛大开曼岛*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 模型 特征 剔除 方法 装置 | ||
1.一种基于模型特征剔除的预测方法,该方法包括:
针对预设的场景,在线学习系统定期进行线上模型训练,基于商品的展现、点击信息以及相关特征生成训练样本,并将生成的训练样本输入到模型中进行线上模型训练,以更新模型特征集;所述预设的场景至少包括广告营销、推荐和搜索场景;
在模型特征集中,确定在当前轮次线上模型训练过程中使用的特征以及未使用的特征;
对于在当前轮次线上模型训练过程中使用的任一特征,执行以下操作:
根据预设的计算算法计算特征使用时刻对应的使用次数;
当当前时刻达到预设的时刻时,利用预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到特征的当前使用次数;
对于在当前轮次线上模型训练过程中未使用的任一特征,执行以下操作:
当当前时刻达到所述预设的时刻时,获取特征的历史使用次数;利用预设的衰减算法对特征的历史使用次数进行衰减得到特征的当前使用次数;
对于模型特征集中的任一特征,判断特征的当前使用次数是否小于预设的阈值;若是,则从模型特征集中剔除,以使线上模型进行特征更新;
基于更新后的线上模型进行预测。
2.根据权利要求1所述的方法,对于在当前轮次线上模型训练过程中使用的任一特征,所述方法还包括:
记录特征使用时刻;
所述当当前时刻达到预设的时刻时,利用预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到特征的当前使用次数,包括:
当当前时刻达到预设的时刻时,将当前时刻与特征使用时刻作差得到第一时间差,与预设的时间差进行比较;
若所述第一时间差大于所述预设的时间差,则利用预设的衰减算法对特征使用时刻对应的使用次数进行衰减得到特征的当前使用次数。
3.根据权利要求1所述的方法,对于在当前轮次线上模型训练过程中未使用的任一特征,所述方法还包括:
当当前时刻达到所述预设的时刻时,获取特征历史使用时刻;
所述利用预设的衰减算法对特征的历史使用次数进行衰减得到特征的当前使用次数,包括:
将当前时刻与特征历史使用时刻作差得到第二时间差,与预设的时间差进行比较;
若所述第二时间差大于所述预设的时间差,则利用所述预设的衰减算法对特征的历史使用次数进行衰减得到特征的当前使用次数。
4.根据权利要求1至3任一项所述的方法,所述预设的衰减算法为:
其中,对于在当前轮次线上模型训练过程中使用的任一特征,所述y为特征的当前使用次数,所述y0为特征使用时刻对应的使用次数,所述α为衰减系数,所述T为预设的时间差,所述t为当前时刻,所述t0为特征使用时刻;
其中,对于在当前轮次线上模型训练过程中未使用的任一特征,所述y为特征的当前使用次数,所述y0为特征的历史使用次数,所述α为衰减系数,所述T为预设的时间差,所述t为当前时刻,所述t0为特征历史使用时刻。
5.根据权利要求2所述的方法,所述根据预设的计算算法计算特征使用时刻对应的使用次数,包括:
获取特征历史使用时刻,将特征使用时刻与特征历史使用时刻作差得到第三时间差,与预设的时间差进行比较;
若所述第三时间差小于预设的时间差,则根据预设的第一计算算法计算特征使用时刻对应的使用次数;
若所述第三时间差不小于预设的时间差,则根据预设的第二计算算法计算特征使用时刻对应的使用次数。
6.根据权利要求5所述的方法,所述若所述第三时间差小于预设的时间差,则根据预设的第一计算算法计算特征使用时刻对应的使用次数,包括:
若所述第三时间差小于预设的时间差,则在特征的历史使用次数的基础之上加1计算得到特征使用时刻对应的使用次数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811636726.9/1.html,转载请声明来源钻瓜专利网。





