[发明专利]一种基于决策树和逻辑回归的点击率预估方法在审
| 申请号: | 201711439302.9 | 申请日: | 2017-12-27 |
| 公开(公告)号: | CN108182597A | 公开(公告)日: | 2018-06-19 |
| 发明(设计)人: | 彭文元;周小强;申晓宏 | 申请(专利权)人: | 银橙(上海)信息技术有限公司 |
| 主分类号: | G06Q30/02 | 分类号: | G06Q30/02;G06N99/00 |
| 代理公司: | 上海愉腾专利代理事务所(普通合伙) 31306 | 代理人: | 唐海波 |
| 地址: | 201414 上海市奉贤*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 点击率 预估 决策树 逻辑回归 连接器 线性分类器 级联结构 实时训练 在线学习 稀疏 模型体系结构 流式数据 数据训练 特征数据 训练数据 概率 投放 转换 评估 | ||
1.一种基于决策树和逻辑回归的点击率预估方法,其特征在于,所述基于决策树和逻辑回归的点击率预估方法包括以下步骤:
获取投放信息的相关特征数据;
建立基于决策树与概率稀疏线性分类器级联结构的点击率预估模型;
通过在线连接器生成实时训练数据;
通过实时训练数据训练点击率预估模型进行获得最新的点击率预估模型来进行点击率预估。
2.根据权利要求1所述的基于决策树和逻辑回归的点击率预估方法,其特征在于,所述在线连接器的工作为:在数据中加入标签并以在线方式训练输入的数据,将投放信息展现和投放信息点击通过请求ID进行连接,每次用户使用时都会生成一个唯一的请求ID,通过这个ID将展现和点击进行匹配。
3.根据权利要求2所述的基于决策树和逻辑回归的点击率预估方法,其特征在于,所述通过在线连接器生成实时训练数据包括以下步骤:
用户访问网站或者app,用户的相关信息会传递到系统中;
系统通过排序将相关的投放信息返回给用户的设备上;
将上述过程产生的数据记录在展现数据流中;
当用户点击他所看到的投放信息时,这个点击数据记录在点击数据流中;
当时间窗口期过后,在线连接器就会把连接好的展现数据发送到训练数据集中。
4.根据权利要求3所述的基于决策树和逻辑回归的点击率预估方法,其特征在于,在通过在线连接器生成实时训练数据过程中,需要建立异常检测机制。
5.根据权利要求1所述的基于决策树和逻辑回归的点击率预估方法,其特征在于,使用在线学习方法训练线性分类器。
6.根据权利要求1所述的基于决策树和逻辑回归的点击率预估方法,其特征在于,使用增强决策树来对特征进行转换。
7.根据权利要求6所述的基于决策树和逻辑回归的点击率预估方法,其特征在于,所述增强决策树包括:每棵单独的树都为一个分类特征,它的值就是树叶的索引值。
8.根据权利要求6所述的基于决策树和逻辑回归的点击率预估方法,其特征在于,所述增强决策树训练数据的方式是以批量形式进行训练的。
9.权利要求6所述的基于决策树和逻辑回归的点击率预估方法,其特征在于,对每个特征都加入了特征权重,在每个树节点结构中,选择并分割一个最佳特征,一旦一个特征在多棵树中使用时,每个特征的重要性会通过将整棵树全部的损失值相加计算得出。
10.根据权利要求1至9之一所述的基于决策树和逻辑回归的点击率预估方法,其特征在于,所述基于决策树和逻辑回归的点击率预估方法包括:使用抽样方法处理大量训练数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于银橙(上海)信息技术有限公司,未经银橙(上海)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711439302.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于大数据环境下企业销售管理方法
- 下一篇:用户价值分类方法和装置





