[发明专利]利用嵌套机器学习模型来执行预测的方法及系统在审
申请号: | 202110772622.6 | 申请日: | 2017-05-05 |
公开(公告)号: | CN113610240A | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 陈雨强;戴文渊;杨强;郭夏玮;涂威威 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 王艳茹;苏银虹 |
地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 利用 嵌套 机器 学习 模型 执行 预测 方法 系统 | ||
提供了一种利用嵌套机器学习模型来执行预测的方法及系统,其中,所述嵌套机器学习模型包括根据上下层嵌套框架训练出的上层模型和下层模型,所述方法包括:(A)获取预测数据记录;(B)基于预测数据记录的属性信息来生成与预测数据记录对应的预测样本的多个特征子集;(C)将预测样本的多个特征子集分别提供给嵌套机器学习模型所包括的上层模型和下层模型,以得到嵌套机器学习模型针对预测样本的预测结果。根据所述系统和方法,能够有效地融合多种类型的子模型来协同工作,充分发挥各个子模型的优势以取得较好的综合机器学习效果。
本申请是申请日为2017年5月5日、申请号为201710311867.2、题为“利用嵌套机器学习模型来执行预测的方法及系统”的专利申请的分案申请。
技术领域
本发明的示例性实施例总体说来涉及人工智能领域,更具体地说,涉及一种利用嵌套机器学习模型来执行预测的方法及系统以及一种训练嵌套机器学习模型的方法及系统。
背景技术
随着海量数据的出现,人工智能技术得到了迅速发展,而为了从海量数据中挖掘出价值,需要基于数据记录来产生适用于机器学习的训练和/或预测样本,以有助于训练出机器学习模型和/或利用训练好的机器学习模型来执行预估。
这里,每条数据记录可被看做关于一个事件或对象的描述,对应于一个示例或样例。在数据记录中,包括反映事件或对象在某方面的表现或性质的各个事项,这些事项可称为“属性”。通过对数据记录的属性信息进行诸如特征工程等处理,可产生包括各种特征的机器学习样本。
在实际的机器学习应用中,数据记录的属性信息在形式或含义等方面各有特点,相应地,所产生的特征也在形式或含义等方面存在各种差异,这使得单个机器学习样本中往往存在不同情况的特征。
然而,由于应用机器学习技术的场景必然会面临计算资源有限、样本数据不足、特征处理脱离应用场景等客观问题,所以现实中难以找到一种机器学习模型,使其能够在各种特征上均具有适当的表现。例如,在现有技术中,存在利用线性模型和神经网络模型来融合训练广度和训练深度的方案(请参见Google的论文“WideDeep Learning forRecommender Systems”),但是上述方案存在训练复杂、计算复杂度高、参数调节困难等缺陷,在工业界的应用受到很大限制。
发明内容
本发明的示例性实施例旨在克服单一机器学习模型无法较好地适用于所有类型特征的缺陷。
根据本发明的示例性实施例,提供一种利用嵌套机器学习模型来执行预测的方法,其中,所述嵌套机器学习模型包括根据上下层嵌套框架训练出的上层模型和下层模型,所述方法包括:(A)获取预测数据记录;(B)基于预测数据记录的属性信息来生成与预测数据记录对应的预测样本的多个特征子集;(C)将预测样本的多个特征子集分别提供给嵌套机器学习模型所包括的上层模型和下层模型,以得到嵌套机器学习模型针对预测样本的预测结果。
可选地,在所述方法中,所述上层模型包括一个决策树子模型,并且,所述下层模型包括多个线性子模型,其中,每个线性子模型对应于所述决策树子模型的一个叶子节点。
可选地,在所述方法中,在步骤(B)中,基于预测数据记录的属性信息来生成预测样本的特征,并根据特征的取值连续性和/或取值空间规模来生成预测样本的上层特征子集和预测样本的下层特征子集。
可选地,在所述方法中,上层特征子集涵盖取值为连续值的全部特征,并且,下层特征子集涵盖取值为非连续值的全部特征;或者,上层特征子集涵盖取值为连续值的全部特征连同至少一部分取值为非连续值的特征,并且,下层特征子集涵盖其余取值为非连续值的特征。
可选地,在所述方法中,在步骤(B)中,基于预测数据记录的属性信息来生成预测样本的特征,并根据特征的缺失性来生成预测样本的上层特征子集和预测样本的下层特征子集,其中,特征的缺失性指示该特征是否基于预测数据记录相对于训练数据记录的缺失属性信息而生成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110772622.6/2.html,转载请声明来源钻瓜专利网。