[发明专利]一种搭建个性化推荐引擎的人工智能算法模型有效
申请号: | 201710393578.1 | 申请日: | 2017-05-27 |
公开(公告)号: | CN107203628B | 公开(公告)日: | 2021-04-09 |
发明(设计)人: | 李华煜;梁丽丽;谭荣棉 | 申请(专利权)人: | 广州舜飞信息科技有限公司 |
主分类号: | G06F16/9535 | 分类号: | G06F16/9535;G06F17/18;G06Q30/02 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 谭英强 |
地址: | 510665 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 搭建 个性化 推荐 引擎 人工智能 算法 模型 | ||
1.一种搭建个性化推荐引擎的人工智能算法模型,其特征在于,所述搭建个性化推荐引擎的人工智能算法模型的逻辑回归通过线性加权和sigmoid变换预估目标事件的发生概率,包括以下步骤:
1)特征的聚合方式
特征聚合的方法为基于绝对值的聚合的方法,通过设定绝对值区间,根据点击率或注册率把特征聚合到相应的区间;考虑到特征的点击率或注册率的分布,设定在较小值区域;考虑对点击率或者注册率作指数变换也能达到“在值较小的区域,划分区间也较小”的效果,指数变换描述如下:
xi是特征i的点击率或者注册率,设定y_i为排序比率,yi是变换结果,考虑基于排序的方法,计算α*的值:
对变换后yi进行整数化,实现特征聚合:
由于α*是基于排序估计出来的,yi在[0,1]之间的分布较为均匀,因此m的设定也和聚合后的特征数也比较接近;设定点击率模型的m=1000,注册率模型的m=500;
2)代码流程
get_alpha.py
计算和测试指数变换参数α*,输入:行分割的0~1之间的浮点数,输出:输入数据经过指数变换后在100个分桶的计数分布,以及α*值,
ctr_feature_stat.sh
修改analysis_cross_features任务使用脚本为analysis_cross_features_alpha.py或analysis_cross_features_share_param.py,以及analysis_ctr.10008.confrun_all.sh或run_rgr_all.sh
指定online标志位即进行模型增量更新:
ctr_features_stat.sh读入配置文件CTR_ONLINE_FEATURES指定的增量训练数据,并生成新的mappingtablecal_features.sh读入上述的增量训练数据,并生成增量训练样本;
train_model.local.sh读入增量训练样本和目前的模型参数,并作增量训练,生成新的ctrmappingtable,所述的搭建个性化推荐引擎的人工智能算法模型的线上样品特征缺失的处理方式,包括以下几种:
解决方案1:最初使用的方案,通过复制样品,然后将所有缺省的特征值设为-1,来作为没有特征值时该特征的特征值参数;
解决方案2:在初始化模型时,将模型的常数项直接取对应样品统计平均值的参数,使得模型的基准值变为更合理的统计平均值的参数,这样在缺失特征时,模型也就是回归到统计平均值;
解决方案3:使用解决方案2确定常数项,同时复制样品并且随机抛弃特征或者使用解决方案1中将未采集特征值的特征的特征值均设为-1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州舜飞信息科技有限公司,未经广州舜飞信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710393578.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种待定行程车票的订购乘车方法和系统
- 下一篇:一种FXR激动剂