[发明专利]一种基于融合结构的展示广告点击率预测方法在审
申请号: | 201810315249.X | 申请日: | 2018-04-10 |
公开(公告)号: | CN108520442A | 公开(公告)日: | 2018-09-11 |
发明(设计)人: | 刘梦娟;曾贵川;岳威;孟园;银盈 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 611731 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练数据集 子结构 融合 广告点击率 预测 广告投放 预测模型 点击率 展示 预处理 预测模型训练 广告展示 投放系统 因子分解 用户点击 嵌入层 堆叠 权重 向量 嵌入 样本 智能 广告 记录 | ||
本发明公开一种基于融合结构的展示广告点击率预测方法,目的是使得展示广告的智能投放系统能够将广告投放到预测用户点击率高的展示机会上。首先,基于已有的广告投放记录建立样本并对特征进行预处理,从而得到训练数据集;其次,利用训练数据集,基于因子分解机预测模型训练得到每个特征对应的嵌入向量和一阶特征的权重;第三,建立融合结构,包括嵌入层、Deep子结构、Product子结构和堆叠子结构;第四,利用训练数据集对融合结构的参数进行训练,得到最终的预测模型的参数;最后,对于一个新的广告展示机会,基于训练好的点击率预测模型计算预测点击率。
技术领域
本发明属于互联网应用技术领域,特别涉及一种面向展示广告智能投放的点击率预测方法。
背景技术
随着互联网的广泛普及以及大数据技术的快速发展,使得广告商利用互联网平台进行广告精准营销成为可能。与传统广告相比,在线广告在覆盖范围、灵活性、针对性、成本和效果评估等方面拥有得天独厚的优势,已经发展成为具有数十亿美元的产业。展示广告属于在线广告的一种投放形式,指的是当一个用户浏览网页时,网站通过在网页上嵌入的广告位,向用户展示广告,如附图1所示。展示广告的智能投放,指的是网站可以根据不同的场景动态投放广告,例如根据用户的属性投放广告,或者根据用户浏览网页的类型投放广告等。在展示广告智能投放中,每当一个用户请求嵌入了广告位的网页时,广告位的脚本代码就会向网站的广告投放系统发起一次广告展示的请求,通常称为一次“广告展示机会”;广告投放系统会根据广告展示机会的属性筛选出一组符合投放规则的广告,然后预测出每个广告投放到这次广告展示机会的用户点击概率,将预测点击率最高的广告投放给这次广告展示机会。这里广告展示机会的属性,通常包括用户属性和上下文场景属性,其中用户属性可以是用户的性别、年龄、使用的浏览器类型、所在的城市等,上下文场景属性可以是打开网页的类型、网站的类型等。投放规则通常是由广告商规定的广告投放要求,例如只将广告投放给所在城市为成都的女性用户的广告展示机会,或者只投放给浏览网页为体育类的广告展示机会。
目前常用的点击率(Click-Through Rate,CTR)预测方法包括基于逻辑回归模型的预测方法、基于因子分解机模型(Factorization Machine,FM)的预测方法、基于梯度提升决策树和逻辑回归的预测方法等,这些方法基本都是基于浅层的机器学习模型。近年来随着深度学习在计算机视觉、语音识别、自然语言处理等领域取得巨大成功,其在探索属性间高阶隐含信息的能力也被应用到了展示广告的点击率预测中。目前已有的基于深度学习模型的点击率预测方法通常是基于单个深度神经网络模型,例如基于因子分解机的神经网络模型。本发明设计了一个新的融合结构,利用新的融合结构来完成点击率预测模型的训练。本发明提出的点击率预测方法与其它已有的方法相比,能够利用更丰富的属性之间的高阶隐含信息,通过大量基于真实场景数据的实验表明,本发明提出的基于融合结构的展示广告点击率预测方法能够比传统的点击率预测方法以及最新的基于深度学习的预测方法获得更好的预测性能。
发明内容
本发明的目的是提供一种面向展示广告智能投放的点击率预测方法,该方法能够灵活融合不同结构的深度神经网络来分别学习广告展示机会原始特征的高阶表示,从而实现更为准确的点击率预测。为实现上述发明目的,本发明提供的基于融合结构的展示广告点击率预测方法,其特征在于,包括以下步骤:
步骤1:基于真实广告的投放和点击记录建立样本,对每次广告展示机会和广告本身的属性进行预处理,建立训练数据集,具体如下:
步骤1.1:广告投放系统会对已经发生的广告投放和点击行为进行记录,每条记录包括:广告展示机会的属性、投放的广告的属性、是否发生点击行为;这里广告展示机会的属性又进一步分为用户属性和上下文场景属性,用户属性可以是用户的年龄、性别、所在城市、浏览器类型等,上下文场景属性可以是浏览网页的类型、广告位的大小、广告位的可见度等;投放广告的属性可以是广告创意的类型、广告商等;当广告投放到广告展示机会后用户发生点击行为,则点击记录为1,否则记录为0;在本发明中将每条广告投放记录作为一个数据样本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810315249.X/2.html,转载请声明来源钻瓜专利网。