[发明专利]基于用户行为的广告点击率预测方法有效

专利信息
申请号: 201810608374.X 申请日: 2018-06-13
公开(公告)号: CN108830416B 公开(公告)日: 2020-02-18
发明(设计)人: 琚生根;孙界平;李兴国;王婧妍;刘宁宁;张芮;金玉 申请(专利权)人: 四川大学
主分类号: G06Q10/04 分类号: G06Q10/04;G06Q30/02
代理公司: 成都东恒知盛知识产权代理事务所(特殊普通合伙) 51304 代理人: 何健雄
地址: 610041 四川*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 用户 行为 广告 点击率 预测 方法
【说明书】:

发明公开了一种基于用户行为的广告点击率预测方法,将ID类特征与其他特征在不同层次上进行联合转换为有意义的数值特征,该特征能降低特征稀疏性和冗余度以及提高特征表达性;同时,为进一步提高特征表达性,本发明利用了GBDT模型进行特征选择与特征组合,利用LR模型来处理高维特征;最后为解决类别不平衡问题,本发明提出了基于K_Means模型的下采样算法。实验过程中,首先对原始特征进行特征提取,然后采用启发式思维进行特征分类,将感性特征输入GBDT模型进行特征组合,最后,将理性特征与组合特征以一定的权值输入LR模型进行广告点击率预测。实验结果表明,本发明算法在RMSE与R2指标上均有改善。

技术领域

本发明涉及一种广告点击率预测算法,尤其涉及一种基于用户行为的广告点击率预测方法。

背景技术

互联网的快速发展,为广告业提供了广阔的平台。互联网广告[1-2]具有受众范围广、交互性强、实时灵活等优点,使得广告行业逐渐向其倾斜。互联网广告可以利用用户上网行为,挖掘用户兴趣,达到广告的精准推送,既提升了用户体验,又带来了经济效益。点击率预测算法是广告系统的核心算法之一,是基于会话日志在给定用户查询与广告时,预测用户点击广告的概率。

准确的广告点击率预测会给用户带来良好的体验,也会给网站拥有者和广告商带来更大的经济效益[3-5],因此,无论是工业界中还是学术界中,都出现了越来越多的计算广告的研究者。MJ Effendi[6]等人提出了基于线性回归的上下文广告点击率预测算法,该算法利用上下文信息对广告间的相互影响进行建模,利用聚类算法辅助计算文本相似度,该算法简单高效,易于调参,但很难学习特征之间的复杂关系。Y Juan[7]等人提出了基于域的因子分解机的在线广告点击率预测算法,该算法能够解决数据稀疏性问题,但模型参数较多,模型效率较低,同时,很难学习特征之间的高阶关系。N Yin[8]等人采用基于MapReduce的耦合逻辑回归模型对广告点击率进行预测,该算法利用MapReduce的分而治之思想来处理大量稀疏数据,同时,利用基于方向导数的拟牛顿优化方法来处理非凸非光滑数据集,但模型很难学习特征间的复杂关系。H Guo[9]等人采用基于因子分解机与神经网络的融合模型对广告点击率进行预测,该算法利用因子分解机的特性和神经网络的体系结构,来学习特征之间的复杂关系,提高模型预测准确率。

目前研究存在以下难点[10-12]:1、广告点击日志文件数据量大且增长较快;2、广告点击日志文件包含大量取值较多的类别特征;3、广告点击率数值较小且呈长尾分布,同时,存在类别不平衡问题;4、很难基于某种假设对兴趣漂移现象建模。

发明内容

本发明为了解决上述问题而提供一种基于用户行为的广告点击率预测方法。

本发明通过以下技术方案来实现上述目的:

本发明首先采用基于K_Means模型的下采样算法来解决类别不平衡问题,然后,采用启发式思维对特征进行特征分类,再然后,利用梯度提升树对感性特征进行特征组合,最后,将组合后的特征与理性特征按一定权重输入逻辑回归模型进行广告点击率预测;

特征提取:

基于实验数据集及实际业务分析,进行特征提取工作,目的是降低特征冗余度和特征稀疏性以及提高特征表达性;主要特征如下:

查询相关度:

本发明文本特征属于短文本且经过加密处理,同时,广告关键字、广告标题、广告描述互为强相关,所以,本发明采用Dice系数、Jaccard距离、tf_idf来联合计算文本相似度;

Dice系数计算公式如公式1所示:

其中,comm(t1,t2)表示文本1与文本2的共同部分,len(t1)表示文本1的总词数;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810608374.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top