[发明专利]用于训练模型的方法和装置在审
| 申请号: | 201811157474.1 | 申请日: | 2018-09-30 |
| 公开(公告)号: | CN109325541A | 公开(公告)日: | 2019-02-12 |
| 发明(设计)人: | 李文峰;陈诗妮;宝腾飞 | 申请(专利权)人: | 北京字节跳动网络技术有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
| 代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
| 地址: | 100041 北京市石景山区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 机器学习 机器学习算法 训练数据 方法和装置 训练数据集 参数信息 目标机器 配置文件 训练模型 数据集 分类模型 模型训练 数据集中 预置 标签 集合 关联 学习 申请 | ||
本申请实施例公开了用于训练模型的方法和装置。该方法的一具体实施方式包括:获取配置文件,其中,配置文件包括数据集标识、机器学习框架标识、机器学习算法标识和参数信息;从数据集标识所指示的数据集中选取数据作为训练数据,生成训练数据集;从预置的机器学习框架集合中选取机器学习框架标识所指示的机器学习框架作为目标机器学习框架;在目标机器学习框架下,利用机器学习算法标识所指示的机器学习算法和参数信息所指示的参数,基于训练数据集和训练数据集中的训练数据所关联的标签,训练得到分类模型。该实施方式可以使用户根据实际需要选择不同的机器学习框架和相应的机器学习算法、参数,扩展了模型训练的适用范围。
技术领域
本申请实施例涉及计算机技术领域,具体涉及用于训练模型的方法和装置。
背景技术
随着机器学习逐渐被各行各业采用,通用的机器学习模型往往无法满足用户的定制化的AI(Artificial Intelligence,人工智能)需求。用户通常会想到使用特定的数据,定制化训练自己的模型以适应特定的场景,如图像分类、物体检测、声音识别、声纹识别等等。由于不同种类的模型可能需要在不同种类的机器学习框架下训练,而现有的模型训练系统通常支持有限的机器学习框架,因此,现有的模型训练系统一般无法满足用户的不同的模型训练需求。
发明内容
本申请实施例提出了用于训练模型的方法和装置。
第一方面,本申请实施例提供了一种用于训练模型的方法,该方法包括:获取配置文件,其中,配置文件包括数据集标识、机器学习框架标识、机器学习算法标识和参数信息;从数据集标识所指示的数据集中选取数据作为训练数据,生成训练数据集,其中,数据集中的数据预先关联标签;从预置的机器学习框架集合中选取机器学习框架标识所指示的机器学习框架作为目标机器学习框架;在目标机器学习框架下,利用机器学习算法标识所指示的机器学习算法和参数信息所指示的参数,基于训练数据集和训练数据集中的训练数据所关联的标签,训练得到分类模型。
在一些实施例中,配置文件还包括用于表征数据集所关联的标签与目标标签之间的对应关系的对应关系信息,目标标签是在训练过程中用于预测的标签;以及利用机器学习算法标识所指示的机器学习算法和参数信息所指示的参数,基于训练数据集和训练数据集中的训练数据所关联的标签,训练得到分类模型,包括:利用上述机器学习算法和上述参数,基于训练数据集、训练数据集中的训练数据所关联的标签和对应关系信息,训练得到分类模型。
在一些实施例中,上述方法还包括:执行以下展示操作:从数据集中选取数据作为测试数据,生成测试数据集;利用分类模型对测试数据集中的测试数据进行类别预测,得到预测结果;基于测试数据集中的测试数据所关联的标签和预测结果,对分类模型进行预测效果评估,生成评估结果,以及展示评估结果。
在一些实施例中,上述展示操作的步骤还包括:对训练轮数执行递增操作;确定训练轮数是否达到目标训练轮数,若是,则结束上述展示操作;如果训练轮数未达到目标训练轮数,则将分类模型作为初始模型,从数据集中重新选取数据作为训练数据,生成训练数据集,在目标机器学习框架下,利用上述机器学习算法,基于重新生成的训练数据集和训练数据集中的训练数据所关联的标签,对初始模型进行训练,得到分类模型,以及继续执行所述展示操作。
在一些实施例中,获取配置文件包括:获取用户在配置界面上配置的信息,基于该信息生成配置文件,其中,配置界面包括机器学习框架选取区域、机器学习算法选取区域和参数信息选取区域。
在一些实施例中,机器学习算法选取区域中展示有至少一个机器学习算法名称组,机器学习算法名称组是按照机器学习算法的用途划分的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811157474.1/2.html,转载请声明来源钻瓜专利网。





