[发明专利]用于信息推送的方法及装置在审
申请号: | 201711347617.0 | 申请日: | 2017-12-15 |
公开(公告)号: | CN109934369A | 公开(公告)日: | 2019-06-25 |
发明(设计)人: | 陈辉;郭雪茹 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q30/02;G06Q30/06 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 阚梓瑄;王卫忠 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征数据 信息推送 第一数据 预测 计算机信息处理 行为特征数据 用户特征数据 基础数据 时间维度 输入预测 数据清洗 特征生成 用户购买 浏览行为 数据源 申请 搜索 挖掘 营销 概率 利润 | ||
1.一种用于信息推送的方法,其特征在于,包括:
将由数据源获取的基础数据进行数据清洗,生成第一数据;
提取所述第一数据的特征生成特征数据,所述特征数据包括用户特征数据,搜索行为特征数据,浏览行为特征数据,时间维度特征数据,交叉特征数据,以及衍生特征数据;
将所述特征数据输入预测模型中确定预测得分;以及
通过所述预测得分进行信息推送。
2.如权利要求1所述的方法,其特征在于,所述将由数据源获取的基础数据进行数据清洗,生成第一数据,包括:
将由多个数据源获取的基础数据分别进行数据清洗,生成多个所述第一数据。
3.如权利要求2所述的方法,其特征在于,所述将所述特征数据输入与预测模型中确定预测得分,包括:
所述特征数据输入与其数据源对应的所述预测模型中以确定预测得分。
4.如权利要求1所述的方法,其特征在于,所述提取所述第一数据的特征生成特征数据,包括:
根据特征数据的特点选取对应的特征提取方式对所述第一数据进行特征提取。
5.如权利要求1所述的方法,其特征在于,还包括:
通过对负样本进行训练建立所述预测模型。
6.如权利要求5所述的方法,其特征在于,所述通过对负样本进行训练建立所述预测模型,包括:
将所有负样本随机分份生成N份的第一负样本,其中N为正整数;
对所有负样本进行放回采样,生成M份的第二负样本,其中M为正整数;
通过N份第一负样本与M份第二负样本生成负样本数据;以及
通过负样本数据训练建立所述预测模型。
7.如权利要求6所述的方法,其特征在于,所述通过对负样本进行训练建立所述预测模型,包括:
通过梯度提升树与负样本数据,建立M+N份模型;
通过梯度提升树进行分类训练,获取分类模型X;
通过随机森林结合梯度提升树进行分类训练,获取分类模型Y;以及
通过分类模型X与分类模型Y建立所述预测模型。
8.如权利要求7所述的方法,其特征在于,在分类训练时,正样本相同,负样本随机为M+N份负样本中的一个。
9.如权利要求7所述的方法,其特征在于,所述将所述特征数据输入预测模型中确定预测得分,包括:
将所述特征数据输入预测模型中,所述预测模型中包括M+N份模型;
获取M+N份模型计算生成的M+N份预测数据;以及
通过投票选举与平均加权法获得预测得分。
10.如权利要求9所述的方法,其特征在于,所述通过投票选举与平均加权法获得预测得分,包括:
其中,α+β=1&&α,β>0;
其中,中M份模型中有M1份对样本标记为正样本,N份模型有N1份样本标记为正样本,α,β为权重系数。
11.如权利要求5所述的方法,其特征在于,还包括:
通过滑动窗口获取正样本;以及
通过对正样本进行训练建立所述预测模型。
12.一种用于信息推送的装置,其特征在于,包括:
数据清洗模块,用于将由数据源获取的基础数据进行数据清洗,生成第一数据;
特征提取模块,用于提取所述第一数据的特征生成特征数据,所述特征数据包括用户特征数据,搜索行为特征数据,浏览行为特征数据,时间维度特征数据,交叉特征数据,以及衍生特征数据;
数据预测模块,用于将所述特征数据输入预测模型中确定预测得分;以及
信息推送模块,用于通过所述预测得分进行信息推送。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711347617.0/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理