[发明专利]预测流程模型的生成方法、装置、存储介质和电子设备有效
申请号: | 201811625614.3 | 申请日: | 2018-12-28 |
公开(公告)号: | CN109800887B | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 张延凤 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06K9/62 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 李鹏;魏嘉熹 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预测 流程 模型 生成 方法 装置 存储 介质 电子设备 | ||
本公开涉及一种预测流程模型的生成方法、装置、存储介质和电子设备,该方法包括:对原始训练数据进行数据转化,以生成多个转化特征数据,数据转化方式包括针对于无规律数据的处理模型和针对于有规律数据的处理规则;通过特征评估算法对全量特征数据进行评估,以确定有效特征数据;通过有效特征数据对从模型库中提取出的多个算法模型进行训练,以获取该多个算法模型组合出的机器学习模型;对该机器学习模型和该处理规则进行拼装,以生成预测流程模型。能够在对训练数据进行探索和处理的过程中记录规律性数据对应的处理规则,并对所有特征数据进行筛选,生成兼具处理规则和机器学习模型的预测流程,在提高预测精度的同时拓宽预测模型的适用范围。
技术领域
本公开涉及机器学习领域,具体地,涉及一种预测流程模型的生成方法、装置、存储介质和电子设备。
背景技术
机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析以及算法复杂度理论等多个领域。开发机器学习模型需要一个耗时的并由专家驱动的工作流程,这个流程包括数据准备、特征选择、模型或参数选择、训练以及调优等,因此,机器学习的使用门槛到目前为止依然很高。通过自动化机器学习可以降低机器学习的门槛,自动化机器学习使用许多不同的统计和深度学习技术,旨在使复杂的机器学习模型开发工程实现自动化。相关技术中,在对机器学习模型进行自动化建模时,通常需要以现有训练数据中的所有特征为依据从模型库中选取适当的模型,进而对选取的模型进行训练,再将训练好的模型投入使用。这种建模方式只是对训练数据的整体进行一个模糊的评价,进而选择适当的模型组合生成对应的机器学习模型,欠缺对训练数据中不同类型的特征数据的探索和筛选。这会导致训练出的机器学习模型不能够适用于对规律性数据的描述性分析任务,并且对于预测性的数据分析任务的预测精度也较低。
发明内容
为克服相关技术中存在的问题,本公开的目的是提供一种预测流程模型的生成方法、装置、存储介质和电子设备。
为了实现上述目的,根据本公开实施例的第一方面,提供一种预测流程模型的生成方法,所述方法包括:
对原始训练数据进行数据转化处理,以生成用于描述所述原始训练数据的多个转化特征数据,所述数据转化处理的处理方式包括针对于无规律特征数据的处理模型以及针对于有规律特征数据的处理规则;
通过预设的特征评估算法对全量特征数据进行评估,以确定所述全量特征数据中的有效特征数据,所述全量特征数据包括所述原始训练数据和所述多个转化特征数据;
通过所述有效特征数据对从模型库中提取出的多个算法模型进行训练,以获取所述多个算法模型组合出的第一机器学习模型;
对所述第一机器学习模型以及模型训练脚本中记录的所述处理规则进行拼装,以生成预测流程模型。
可选的,所述模型训练脚本还用于记录所述第一机器学习模型的训练步骤,在所述通过所述第一机器学习模型以及模型训练脚本中记录的所述处理规则,生成预测流程模型之后,所述方法还包括:
每隔预设时间间隔,针对于所述预设时间间隔内更新的训练数据和所述原始训练数据重新执行所述训练步骤,以训练出第二机器学习模型,所述训练步骤至少包括:转化特征数据生成步骤、特征数据评估步骤以及算法模型组合步骤;
通过所述第二机器学习模型替换所述第一机器学习模型,以对所述预测流程模型进行更新。
可选的,所述通过数据转化方式对原始训练数据进行处理,以生成用于描述所述原始训练数据的多个转化特征数据,包括:
根据所述原始训练数据中每组特征数据的数据特性确定所述每组特征数据对应的处理模型或处理规则,以获取多种处理模型和多种处理规则;
通过所述每组特征数据对应的处理模型或处理规则对所述每组特征数据进行数据转化处理,以生成所述多个转化特征数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811625614.3/2.html,转载请声明来源钻瓜专利网。