[发明专利]一种基于决策树和逻辑回归的点击率预估方法在审
申请号: | 201711439302.9 | 申请日: | 2017-12-27 |
公开(公告)号: | CN108182597A | 公开(公告)日: | 2018-06-19 |
发明(设计)人: | 彭文元;周小强;申晓宏 | 申请(专利权)人: | 银橙(上海)信息技术有限公司 |
主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06N99/00 |
代理公司: | 上海愉腾专利代理事务所(普通合伙) 31306 | 代理人: | 唐海波 |
地址: | 201414 上海市奉贤*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 点击率 预估 决策树 逻辑回归 连接器 线性分类器 级联结构 实时训练 在线学习 稀疏 模型体系结构 流式数据 数据训练 特征数据 训练数据 概率 投放 转换 评估 | ||
本发明公开了一种基于决策树和逻辑回归的点击率预估方法,包括以下步骤:获取投放信息的相关特征数据;建立基于决策树与概率稀疏线性分类器级联结构的点击率预估模型;通过在线连接器生成实时训练数据;通过实时训练数据训练点击率预估模型进行获得最新的点击率预估模型来进行点击率预估;提出了一个基于决策树与概率稀疏线性分类器级联结构的模型体系结构,它还包含了一个在线学习层,并公开了在线连接器,它是一个在线学习层中非常关键的组成部分,可以将训练数据转换成实时的流式数据;本发明所述的基于决策树和逻辑回归的点击率预估方法,相较于现有的点击率评估方法至少有10%的效果提升。
技术领域
本发明涉及计算机技术领域,尤其涉及一种基于决策树和逻辑回 归的点击率预估方法。
背景技术
数字广告是一个价值数十亿美元的产业,并且每年还在持续增长。 大部分的在线广告平台都是动态分配广告的,根据用户的反馈信息做 出调整,进而向用户展现其感兴趣的广告。机器学习在向用户展现哪个 广告中扮演着一个很重要的角色,使用这种类似推荐的模式也会提升 广告的投放效率。
2007年的一篇由Varian和Edelman等人创作的论文介绍了一种 按点击付费的竞价模式,该竞价模式的效果取决于预估点击的准确性。 在平常的竞价中产生的数据是非常大量的,而且会有很多新的特征或 元素加入,所以预估系统需要良好的适应性和处理大量数据的能力。
在搜索广告系统当中,用户所查询的数据就会成为选取候选广告 的依据,但是在广告投放系统中,用户并不会主动去输入任何东西,所 以在向用户展现广告时,就会有大量的广告会匹配上用户的所定向的 一些条件,比如地理位置、兴趣属性、身份信息等。但要从这些大量的 广告当中选取一个最合适的广告,这时就需要借助机器学习来对每个 广告进行点击率(CTR,Click-Through-Rate)预估,进而选取点击率 最高的广告展现给用户。
发明内容
鉴于目前存在的上述不足,本发明提供一种基于决策树和逻辑回 归的点击率预估方法,提出了结合了决策树和逻辑回归的预估模型,提 升了预估效果。
为达到上述目的,本发明的实施例采用如下技术方案:
一种基于决策树和逻辑回归的点击率预估方法,所述基于决策树 和逻辑回归的点击率预估方法包括以下步骤:
获取投放信息的相关特征数据;
建立基于决策树与概率稀疏线性分类器级联结构的点击率预估模 型;
通过在线连接器生成实时训练数据;
通过实时训练数据训练点击率预估模型进行获得最新的点击率预 估模型来进行点击率预估。
依照本发明的一个方面,所述在线连接器的工作为:在数据中加入 标签并以在线方式训练输入的数据,将投放信息展现和投放信息点击 通过请求ID进行连接,每次用户使用时都会生成一个唯一的请求ID, 通过这个ID将展现和点击进行匹配。
依照本发明的一个方面,所述通过在线连接器生成实时训练数据 包括以下步骤:
用户访问网站或者app,用户的相关信息会传递到系统中;
系统通过排序将相关的投放信息返回给用户的设备上;
将上述过程产生的数据记录在展现数据流中;
当用户点击他所看到的投放信息时,这个点击数据记录在点击数 据流中;
当时间窗口期过后,在线连接器就会把连接好的展现数据发送到 训练数据集中。
依照本发明的一个方面,在通过在线连接器生成实时训练数据过 程中,需要建立异常检测机制。
依照本发明的一个方面,使用在线学习方法训练线性分类器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于银橙(上海)信息技术有限公司,未经银橙(上海)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711439302.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于大数据环境下企业销售管理方法
- 下一篇:用户价值分类方法和装置