[发明专利]一种基于栈式自编码器的广告点击率预测的方法在审

专利信息
申请号: 201710159687.7 申请日: 2017-03-17
公开(公告)号: CN106997550A 公开(公告)日: 2017-08-01
发明(设计)人: 梅佳俊;杨长春;杨晋苏;吴云;吴浩 申请(专利权)人: 常州大学
主分类号: G06Q30/02 分类号: G06Q30/02;G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 213164 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 编码器 广告 点击率 预测 方法
【说明书】:

技术领域:

发明涉及互联网计算广告技术领域,准确的说是一种基于栈式自编码器的广告点击率预测方法。

背景技术:

搜索广告目前已经成为互联网行业的主要收入来源之一,也是规模最大,增长最快的广告渠道之一。对于参与搜索广告的广告商、广告媒介和用户三者来说,一方面,广告商通过支付每次点击费用(CostPerClick,CPC)的形式借助广告媒介投放广告,广告媒介的收益则来自于每次点击费用与广告点击率(Click-Through Rate,CTR)预测共同影响而得到,即CPC*CTR,广告点击率预测的准确性与广告商和广告媒介的收益息息相关。另一方面,用户点击广告的概率随着广告位的排放顺序呈递减趋势,对广告点击率进行预测并将预测结果高的广告投放在搜索结果页面靠前的位置,能增加用户的对广告的点击率。搜索广告点击率预测结果的好坏直接关系到广告商与广告媒介的收益,因此,这项研究早已是工业界的热点项目之一。

对于广告点击率预测这一问题,传统方法分别从假设检验,分类,推荐系统等角度进行切入,但这些通过设计提取特征方案获得特征和对用户进行建模的方法,并没有充分考虑广告数据具有的高维稀疏性、特征之间存在高度非线性关联的特点,致使信息利用不充分。

发明内容:

1.鉴于以上现有技术的缺点,本发明提供一种广告点击率预测方法,以提高广告点击率预测的准确性,

其中包括以下步骤:

步骤1:建立广告-查询矩阵,分别对广告和查询进行K-means聚类;

步骤2:对用户-查询-广告三维张量模型进行张量分解;

步骤3:提取影响广告点击率的基本特征;

步骤4:将选取的基本特征作为栈式自编码器的输入层,进行训练,获得高阶组合特征;

步骤5:将高阶组合特征输入逻辑回归模型中,进行训练;

步骤6:模型训练完成,将待预测数据输入训练好的模型,进行预测。

2.在一些实施方式中,步骤1包括:

步骤1-1:用实验数据中提供的广告展示次数作为广告Ai与查询Qj的权重,来建立广告-查询矩阵

步骤1-2:对该广告-查询矩阵采用K-means算法进行聚类;

步骤1-3:初始数据中的用户数、查询数和广告数分别用Nu,Nq和Na表示,相同类型对象内部聚类后,属于同一个簇中的对象用同一个ID表示,将聚类后的用户、查询和广告的簇数分别用Ku,Kq和Ka表示。这样,初始数据集中的用户数、查询数和广告数由原来的Nu,Nq和Na分别降维为Ku,Kq和Ka

其有益效果是,能够解决广告数据的高维稀疏性对预测结果带来的不良影响。

3.在一些实施方式中,步骤4包括:

步骤1:先将选取好的基本特征输入自编码器中进行训练,训练得到的权重参数和偏置参数b作为栈式自编码器输入层和第一层的权重和偏置;

步骤2:将步骤1中训练得到的输出层,作为自编码器的输入层进行训练,得到第一层和第二层的权重和偏置;

步骤3:以此类推,得到各层间的偏置与权重,完成对栈式自编码器的训练。

其有益效果是能够获得数据的高维组合特征,挖掘出数据中的深层非线性联系。

附图说明:

此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,在附图中

图1所示为广告点击率预测方法流程图;

具体实施方式:

本发明将广告数据中的高维数据进行聚类降维和张量分解,再对处理好的数据提取特征,提取的特征作为栈式自编码器的输入,采用逐层贪婪算法完成对栈式自编码器的训练,获得的高阶组合特征的用于训练逻辑回归模型,最后使用AUC曲线作为评价指标对实验结果进行评价。

数据降维是解决数据稀疏性的一个有效手段。针对广告数据中相同类型对象内部之间存在相似性关系,首先对相似对象进行聚类,获得初始的聚合数据;然后,对于不同类型对象之间存在的复杂关联关系,采用张量结构对其建模,并运用张量分解法得到近似张量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常州大学,未经常州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710159687.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top