[发明专利]一种基于深度学习的广告点击率预测方法及装置在审
申请号: | 201511022651.1 | 申请日: | 2015-12-30 |
公开(公告)号: | CN105654200A | 公开(公告)日: | 2016-06-08 |
发明(设计)人: | 董启文 | 申请(专利权)人: | 上海珍岛信息技术有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q30/02 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 200083 上海市虹*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 广告 点击率 预测 方法 装置 | ||
技术领域
本发明涉及互联网计算广告技术领域,更具体地说,涉及一种基于深度 学习的广告点击率预测方法及装置。
背景技术
随着互联网的飞速发展,互联网广告也随之兴起,与传统的广告相比,互 联网广告具有得天独厚的优势,是实施现代营销媒体战略的重要部分之一,以 下均将互联网广告简称为广告。无论是搜索广告、展示广告还是移动设备端 广告,点击率预估问题是互联网广告领域的核心问题,而点击率预估的准确 性,直接影响到用户体验、广告主收益、广告平台收益三方利益,进而影响到 整个广告生态系统的平衡。因此,做好广告点击率预估工作具有十分重要的意 义。
现有技术中通常使用线性学习模型实现广告的点击率预估问题,但是, 发明人发现,使用线性学习模型实现广告的点击率预估问题时,线性模型中 的各个特征对预测结果的关系都是互相独立,彼此不受影响的,因此,线性 模型无法学习特征之间的非线性关系,如高收入人群对奢侈品广告的点击率 要高于普通收入人群,研究人员点击机器学习书籍的概率要大于高中学生等。 但是,实际数据中具有很多的非线性关系的特征,这些特征需要同时出现才 能够对预测结果起到正向作用。因此,现有技术中利用线性模型学习实现广 告的点击率预估问题时,忽略了特征之间的非线性关系,进而导致获取的预 测结果的准确性较差,即广告点击率预测预估的准确性较低,效果较差。
综上所述,现有技术中广告点击率预估存在准确性较低,效果较差的问 题。
发明内容
本发明的目的是提供一种基于深度学习的广告点击率预测方法及装置, 以解决现有技术的广告点击率预估中存在的准确性较低、效果较差的问题。
为了实现上述目的,本发明提供如下技术方案:
一种基于深度学习的广告点击率预测方法,包括:
获取预设量的训练广告,以及每个所述训练广告对应的训练点击率及训 练特征;
将每个所述训练广告的训练特征转换成训练向量,利用所述训练向量及 每个所述训练广告的训练点击率训练深度学习模型,其中,所述深度学习模 型为基于非线性函数实现的;
获取由待测广告的待测特征转换成的待测向量,并将所述待测向量作为 所述深度学习模型的输入,得到与所述待测广告对应的预测点击率。
优选的,获取每个所述训练广告的训练点击率,包括:
获取展示日志及点击日志,其中,所述展示日志记录有被展示过的训练 广告,所述点击日志记录有被点击过的训练广告;
利用所述展示日志及所述点击日志确定每个训练广告对应的展示次数及 点击次数,并确定每个所述训练广告的点击次数与展示次数的商为该训练广 告的训练点击率。
优选的,获取展示日志及点击日志之后,还包括:
将所述展示日志及所述点击日志进行拼接;
将进行拼接后的所述展示日志及所述点击日志中的无效日志进行滤除, 其中,所述无效日志包括残缺的日志及被点击后在对应广告页面上停留时间 小于第一预设值的日志。
优选的,将每个所述训练广告的训练特征转换成训练向量,包括:
对于所述训练特征中的离散型训练特征,统计所述离散型训练特征在所 述训练特征中出现的频次,作为该离散训练特征对应的特征值;对于所述训 练特征中连续型训练特征,统计所述连续性训练特征在所述训练特征中对应 的最大值及最小值,并依据所述最大值及最小值将所述连续型训练特征切分 成预设数量个子训练特征,统计每个所述子训练特征在所述训练特征中出现 的频次,作为该子训练特征对应的连续型训练特征的特征向量值;并将得到 的全部特征值及特征向量值连接起来,得到所述训练向量。
优选的,将得到的全部特征值及特征向量连接起来之前,还包括:
将所述特征值及所述特征向量值中对应的频次小于第二预设值的特征值 或者特征向量值进行删除。
优选的,利用所述训练向量及每个所述训练广告的训练点击率训练深度 学习模型,包括:
采用随机初始化的方法初始化所述深度学习模型中包含的连接权重参 数,其中,所述深度学习模型中包含的隐藏层节点为非线性函数;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海珍岛信息技术有限公司,未经上海珍岛信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511022651.1/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理