[发明专利]基于多级逻辑回归的点击率预测方法和系统有效
申请号: | 201410001103.X | 申请日: | 2014-01-02 |
公开(公告)号: | CN103761266A | 公开(公告)日: | 2014-04-30 |
发明(设计)人: | 崔晶晶;林佳婕;李春华;受春柏;刘立娜 | 申请(专利权)人: | 北京集奥聚合网络技术有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京和信华成知识产权代理事务所(普通合伙) 11390 | 代理人: | 胡剑辉 |
地址: | 100028 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 多级 逻辑 回归 点击率 预测 方法 系统 | ||
1.一种基于多级逻辑回归的点击率预测方法,其特征在于:该方法包括如下步骤:
特征抽取步骤,通过对已获得的点击率数据进行分析,分析对点击率有影响的因素,从中选取特征向量,构建特征模型;
模型训练步骤,使用多级逻辑回归模型,对特征模型进行多级逻辑回归机器学习,得到预测模型;以及
点击率预测步骤:使用预测模型对待预测点击率数据进行预测。
2.如权利要求1所述的预测方法,其特征在于:所述特征抽取步骤中的特征模型为:μ(a,u,c)=p(click|a,u,c),其中,a代表广告,u代表受众,c代表媒体,p()为多级逻辑回归模型,有p(click|a,u,c)=σ(wtx),其中wt表示n维特征权重向量,x表示n维特征向量,σ()为逻辑回归函数,有
3.如权利要求1所述的预测方法,其特征在于:所述特征抽取步骤中的多级逻辑回归机器学习的步骤包括:
自身逻辑回归计算步骤,对特征模型中的N维特征向量进行自身的逻辑回归计算,得到该维特征向量的回归值;
中间逻辑回归计算步骤,选取M个第一级回归值进行中间级计算,其中M<N;以及
最终逻辑回归计算步骤,将中间级回归运算的中间值做为最后一级的回归运算的输入,最后得到点击率的预测值。
4.如权利要求5所述的预测方法,其特征在于:所述中间逻辑回归计算步骤中的中间级计算可以根据实际需要进行多次运算,每一次都将上一级的输出作为下一级的输入进行逻辑回归运算。
5.一种基于多级逻辑回归的点击率预测系统,其特征在于:该系统包括如下装置:
特征抽取装置,用于通过对已获得的点击率数据进行分析,分析对点击率有影响的因素,从中选取特征向量,构建特征模型;
模型训练装置,用于使用多级逻辑回归模型,对特征模型进行多级逻辑回归机器学习,得到预测模型;以及
点击率预测装置:用于使用预测模型对待预测点击率数据进行预测。
6.如权利要求5所述的预测系统,其特征在于:所述特征模型为:μ(a,u,c)=p(click|a,u,c),其中,a代表广告,u代表受众,c代表媒体,p()为多级逻辑回归模型,有p(click|a,u,c)=σ(wtx),其中wt表示n维特征权重向量,x表示n维特征向量,σ()为逻辑回归函数,有
7.如权利要求5所述的预测系统,其特征在于:所述模型训练装置包括多级逻辑回归机器学习装置,该多级逻辑回归机器学习装置包括:
自身逻辑回归计算装置,用于对特征模型中的N维特征向量进行自身的逻辑回归计算,得到该维特征向量的回归值;
中间逻辑回归计算装置:用于选取M个第一级回归值进行中间级计算,其中M<N;
最终逻辑回归计算装置:用于将中间级回归运算的中间值做为最后一级的回归运算的输入,最后得到点击率的预测值。
8.如权利要求7所述的预测系统,其特征在于:所述中间逻辑回归计算装置可以根据实际需要进行多次运算,每一次都将上一级的输出作为下一级的输入进行逻辑回归运算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京集奥聚合网络技术有限公司,未经北京集奥聚合网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410001103.X/1.html,转载请声明来源钻瓜专利网。