[发明专利]一种基于深度学习的广告点击率预测方法及装置在审
申请号: | 201511022651.1 | 申请日: | 2015-12-30 |
公开(公告)号: | CN105654200A | 公开(公告)日: | 2016-06-08 |
发明(设计)人: | 董启文 | 申请(专利权)人: | 上海珍岛信息技术有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q30/02 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 200083 上海市虹*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 广告 点击率 预测 方法 装置 | ||
1.一种基于深度学习的广告点击率预测方法,其特征在于,包括:
获取预设量的训练广告,以及每个所述训练广告对应的训练点击率及训 练特征;
将每个所述训练广告的训练特征转换成训练向量,利用所述训练向量及 每个所述训练广告的训练点击率训练深度学习模型,其中,所述深度学习模 型为基于非线性函数实现的;
获取由待测广告的待测特征转换成的待测向量,并将所述待测向量作为 所述深度学习模型的输入,得到与所述待测广告对应的预测点击率。
2.根据权利要求1所述的方法,其特征在于,获取每个所述训练广告的 训练点击率,包括:
获取展示日志及点击日志,其中,所述展示日志记录有被展示过的训练 广告,所述点击日志记录有被点击过的训练广告;
利用所述展示日志及所述点击日志确定每个训练广告对应的展示次数及 点击次数,并确定每个所述训练广告的点击次数与展示次数的商为该训练广 告的训练点击率。
3.根据权利要求2所述的方法,其特征在于,获取展示日志及点击日志 之后,还包括:
将所述展示日志及所述点击日志进行拼接;
将进行拼接后的所述展示日志及所述点击日志中的无效日志进行滤除, 其中,所述无效日志包括残缺的日志及被点击后在对应广告页面上停留时间 小于第一预设值的日志。
4.根据权利要求1所述的方法,其特征在于,将每个所述训练广告的训 练特征转换成训练向量,包括:
对于所述训练特征中的离散型训练特征,统计所述离散型训练特征在所 述训练特征中出现的频次,作为该离散训练特征对应的特征值;对于所述训 练特征中连续型训练特征,统计所述连续性训练特征在所述训练特征中对应 的最大值及最小值,并依据所述最大值及最小值将所述连续型训练特征切分 成预设数量个子训练特征,统计每个所述子训练特征在所述训练特征中出现 的频次,作为该子训练特征对应的连续型训练特征的特征向量值;并将得到 的全部特征值及特征向量值连接起来,得到所述训练向量。
5.根据权利要求4所述的方法,其特征在于,将得到的全部特征值及特 征向量连接起来之前,还包括:
将所述特征值及所述特征向量值中对应的频次小于第二预设值的特征值 或者特征向量值进行删除。
6.根据权利要求1至5任一项所述的方法,其特征在于,利用所述训练 向量及每个所述训练广告的训练点击率训练深度学习模型,包括:
采用随机初始化的方法初始化所述深度学习模型中包含的连接权重参 数,其中,所述深度学习模型中包含的隐藏层节点为非线性函数;
依次将所述训练向量输入至所述深度学习模型中,并在将任一训练向量 输入至所述深度学习模型后,得到对应的输出点击率,判断该输出点击率与 输入的训练向量对应的训练点击率之间的误差是否大于第三预设值,如果是, 则依据该误差利用反向传播算法更新所述连接权重参数,如果否,则确定当 前的连接权重参数对应的深度学习模型为训练得到的深度学习模型。
7.一种基于深度学习的广告点击率预测装置,其特征在于,包括:
获取模块,用于获取预设量的训练广告,以及每个所述训练广告对应的 训练点击率及训练特征;
训练模块,用于将每个所述训练广告的训练特征转换成训练向量,利用 所述训练向量及每个所述训练广告的训练点击率训练深度学习模型,其中, 所述深度学习模型为基于非线性函数实现的;
测试模块,用于获取由待测广告的待测特征转换成的待测向量,并将所 述待测向量作为所述深度学习模型的输入,得到与所述待测广告对应的预测 点击率。
8.根据权利要求7所述的装置,其特征在于,获取模块包括:
获取单元,用于获取展示日志及点击日志,其中,所述展示日志记录有 被展示过的训练广告,所述点击日志记录有被点击过的训练广告;
计算单元,用于利用所述展示日志及所述点击日志确定每个训练广告对 应的展示次数及点击次数,并确定每个所述训练广告的点击次数与展示次数 的商为该训练广告的训练点击率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海珍岛信息技术有限公司,未经上海珍岛信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201511022651.1/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理