[发明专利]利用复合机器学习模型来执行预测的方法及系统在审

专利信息
申请号: 202110773264.0 申请日: 2017-05-05
公开(公告)号: CN113570064A 公开(公告)日: 2021-10-29
发明(设计)人: 杨强;戴文渊;陈雨强;郭夏玮;涂威威 申请(专利权)人: 第四范式(北京)技术有限公司
主分类号: G06N20/00 分类号: G06N20/00;G06N5/02;G06Q10/04
代理公司: 北京铭硕知识产权代理有限公司 11286 代理人: 王艳茹;苏银虹
地址: 100085 北京市海淀区清*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 利用 复合 机器 学习 模型 执行 预测 方法 系统
【说明书】:

提供了一种利用复合机器学习模型来执行预测的方法及系统,其中,所述复合机器学习模型包括至少两种类型的子模型,所述方法包括:(A)获取预测数据记录;(B)基于预测数据记录的属性信息来生成与预测数据记录对应的预测样本的多个特征子集;(C)将预测样本的多个特征子集分别提供给复合机器学习模型所包括的子模型,以得到复合机器学习模型针对预测样本的预测结果,其中,在所述复合机器学习模型中,所述子模型根据梯度提升框架训练而成。通过这种方式,能够有效地融合多种类型的子模型来协同工作,充分发挥各个子模型的优势以取得较好的综合机器学习效果。

本申请是申请日为2017年05月05日、申请号为201710311433.2、题为“利用复合机器学习模型来执行预测的方法及系统”的专利申请的分案申请。

技术领域

本发明的示例性实施例总体说来涉及人工智能领域,更具体地说,涉及一种利用复合机器学习模型来执行预测的方法及系统以及一种训练复合机器学习模型的方法及系统。

背景技术

随着海量数据的出现,人工智能技术得到了迅速发展,而为了从海量数据中挖掘出价值,需要基于数据记录来产生适用于机器学习的训练和/或预测样本,以有助于训练出机器学习模型和/或利用训练好的机器学习模型来执行预估。

这里,每条数据记录可被看做关于一个事件或对象的描述,对应于一个示例或样例。在数据记录中,包括反映事件或对象在某方面的表现或性质的各个事项,这些事项可称为“属性”。通过对数据记录的属性信息进行诸如特征工程等处理,可产生包括各种特征的机器学习样本。

在实际的机器学习应用中,数据记录的属性信息在形式或含义等方面各有特点,相应地,所产生的特征也在形式或含义等方面存在各种差异,这使得单个机器学习样本中往往存在不同情况的特征。

然而,由于应用机器学习技术的场景必然会面临计算资源有限、样本数据不足、特征处理脱离应用场景等客观问题,所以现实中难以找到一种机器学习模型,使其能够在各种特征上均具有适当的表现。例如,在现有技术中,存在利用线性模型和神经网络模型来融合训练广度和训练深度的方案(请参见Google的论文“WideDeep Learning forRecommender Systems”),但是上述方案存在训练复杂、计算复杂度高、参数调节困难等缺陷,在工业中的应用受到很大限制。

发明内容

本发明的示例性实施例旨在克服单一机器学习模型无法较好地适用于不同情况下的特征的缺陷。

根据本发明的示例性实施例,提供一种利用复合机器学习模型来执行预测的方法,其中,所述复合机器学习模型包括至少两种类型的子模型,所述方法包括:(A)获取预测数据记录;(B)基于预测数据记录的属性信息来生成与预测数据记录对应的预测样本的多个特征子集;以及(C)将预测样本的多个特征子集分别提供给复合机器学习模型所包括的子模型,以得到复合机器学习模型针对预测样本的预测结果,其中,在所述复合机器学习模型中,所述子模型根据梯度提升框架训练而成。

可选地,在所述方法中,所述子模型包括至少一个线性子模型和至少一个决策树子模型。

可选地,在所述方法中,所述子模型包括至少一个上下层嵌套的复合子模型。

可选地,在所述方法中,所述子模型还包括至少一个线性子模型和/或至少一个决策树子模型。

可选地,在所述方法中,所述复合子模型的上层模型为一个决策树模型部分,并且,所述复合子模型的下层模型为至少一个线性模型部分,其中,每个线性模型部分对应于决策树模型部分的一个叶子节点。

可选地,在所述方法中,在步骤(B)中,基于预测数据记录的属性信息来生成预测样本的特征,并根据特征的取值连续性和/或取值空间规模来生成预测样本的决策树特征子集和预测样本的线性特征子集。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110773264.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top