[发明专利]自动集成机器学习的方法、装置、介质及电子设备在审

专利信息
申请号: 202010982700.0 申请日: 2020-09-17
公开(公告)号: CN112116104A 公开(公告)日: 2020-12-22
发明(设计)人: 夏晓华;王美青;吕军;程建波 申请(专利权)人: 京东数字科技控股股份有限公司
主分类号: G06N20/20 分类号: G06N20/20
代理公司: 北京律智知识产权代理有限公司 11438 代理人: 孙宝海;袁礼君
地址: 100176 北京市大兴区北京经*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 自动 集成 机器 学习 方法 装置 介质 电子设备
【说明书】:

发明实施例提供了一种自动集成机器学习的方法、装置、介质和电子设备,所述方法包括:步骤S1:获取预配置的至少两个机器学习模型、超参数搜索空间、集成算法以及集成算法参数组;步骤S2:将在超参数搜索空间的范围内选择的第一超参数输入到各个所述机器学习模型中;步骤S3:根据所述集成算法以及第一集成算法参数将所述至少两个机器学习模型进行集成,生成第一集成模型;步骤S4:对所述第一集成模型进行训练和模型评分,得到评分结果;步骤S5:以依次执行的步骤S2、步骤S3、步骤S4作为一个循环,在重复执行所述循环后,根据各个所述循环的评分结果确定目标集成模型。本发明实施例的技术方案可以得到整体较优的集成模型。

技术领域

本发明涉及计算机技术领域,具体而言,涉及一种自动集成机器学习的方法、装置、计算机可读存储介质及电子设备。

背景技术

机器学习(Machine Learning)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,因而也越来越广泛地被用于各种业务场景。

通过对业务数据的加工处理、特征的加工和选择以及模型选择和参数的调整,可以获取最优的机器学习模型。这个过程包括了大量重复性和经验性的劳动。

自动机器学习技术通过自动特征工程、自动选模、自动调参优化等手段来自动生成机器学习模型,减轻算法人员的劳动量。

为了提高机器学习模型的效果,从准确率、精准度、召回率等多方面评价模型,可以采用集成学习等方法来对多个模型进行集成从而得到效果评分更高的集成模型。

集成学习是一种使用多种兼容的学习算法/模型来执行单个任务的技术,目的是为了得到更佳的预测表现。

现有技术一般是通过自动机器学习来对单个模型进行超参数的优化。而集成学习一般是在对基础模型进行优化后再进行集成学习,并且集成学习的参数也需要调整优化。在对单个模型进行超参数优化和对集成学习进行参数优化的过程按先后顺序串联进行时,实际是进行了分阶段调优的优化,所得到的最终模型虽然在各个阶段进行了调优,但最终整体模型不一定是最优模型。

需要说明的是,在上述背景技术部分公开的信息仅用于加强对本发明的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

发明内容

本发明实施例的目的在于提供一种自动集成机器学习的方法、装置、计算机可读存储介质及电子设备,进而至少在一定程度上得到整体较优的集成模型。

本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。

根据本发明实施例的第一方面,提供一种自动集成机器学习的方法,该方法包括:步骤S1:获取预配置的至少两个机器学习模型、各个所述机器学习模型的超参数搜索空间、集成算法以及所述集成算法的集成算法参数组,其中,所述集成算法参数组包括至少一个集成算法参数;步骤S2:将在所述超参数搜索空间的范围内选择的第一超参数输入到各个所述机器学习模型中;步骤S3:根据所述集成算法以及所述集成算法参数组中的第一集成算法参数将所述至少两个机器学习模型进行集成,生成第一集成模型;步骤S4:对所述第一集成模型进行训练和模型评分,得到评分结果;步骤S5:以依次执行的步骤S2、步骤S3、步骤S4作为一个循环,在重复执行N个所述循环后,根据各个所述循环的评分结果确定目标集成模型,其中,N为正整数。

在一些实施例中,所述步骤S2包括:根据以下任一种集成算法将所述至少两个机器学习模型进行集成:堆叠集成算法、装袋集成算法和提升集成算法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东数字科技控股股份有限公司,未经京东数字科技控股股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010982700.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top