[发明专利]模型训练方法、对象处理方法及装置、电子设备、介质在审
| 申请号: | 202210088006.3 | 申请日: | 2022-01-25 |
| 公开(公告)号: | CN114418121A | 公开(公告)日: | 2022-04-29 |
| 发明(设计)人: | 刘洋;郭彦东;冯天鹏 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/04;G06N3/08 |
| 代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 刘抗美 |
| 地址: | 523860 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模型 训练 方法 对象 处理 装置 电子设备 介质 | ||
1.一种模型训练方法,其特征在于,包括:
获取机器学习模型,所述机器学习模型使用浮点精度训练得到;
对所述机器学习模型的权重进行跨层权重正则化处理,得到正则化后的权重;
确定推理引擎对应的量化信息,并基于所述量化信息确定多个训练参数;
基于所述多个训练参数,对所述机器学习模型对应的正则化后的权重以及特征图进行量化感知训练,以得到训练好的机器学习模型。
2.根据权利要求1所述的模型训练方法,其特征在于,所述对所述机器学习模型的权重进行跨层权重正则化处理,包括:
对机器学习模型中当前层的权重的目标通道乘以第一参数,并对与当前层连接的下一层的权重的目标通道乘以第二参数,以对所述权重进行跨层权重正则化处理;其中,所述第一参数和所述第二参数的乘积为1。
3.根据权利要求1所述的模型训练方法,其特征在于,所述确定推理引擎对应的量化信息,包括:
确定所述推理引擎的数据类型,并根据所述数据类型确定需要量化的数据范围。
4.根据权利要求1所述的模型训练方法,其特征在于,所述基于所述多个训练参数,对所述机器学习模型对应的正则化后的权重以及特征图进行量化感知训练,以得到训练好的机器学习模型,包括:
在所述机器学习模型中插入多个类型的伪量化节点,并根据所述多个类型的伪量化节点确定的训练参数,采用渐进式收缩方式对所述机器学习模型进行伪量化运算,以进行量化感知训练得到训练好的机器学习模型。
5.根据权利要求4所述的模型训练方法,其特征在于,所述在所述机器学习模型中插入多个类型的伪量化节点,并根据所述多个类型的伪量化节点确定的训练参数,采用渐进式收缩方式对所述机器学习模型进行伪量化运算,包括:
在所述机器学习模型中插入当前类型的伪量化节点,并根据所述当前类型的伪量化节点对所述机器学习模型进行伪量化运算,以得到当前机器学习模型;
对所述当前机器学习模型插入下一类型的伪量化节点,并根据所述下一类型的伪量化节点对所述当前机器学习模型进行量化感知训练,得到下一机器学习模型;
为下一机器学习模型插入所有伪量化节点中的剩余伪量化节点,直至为下一机器学习模型插入多个类型的伪量化节点中的所有伪量化节点为止,以得到训练好的机器学习模型。
6.根据权利要求4所述的模型训练方法,其特征在于,所述根据所述多个类型的伪量化节点确定的训练参数,采用渐进式收缩方式对所述机器学习模型进行伪量化运算,以进行量化感知训练得到训练好的机器学习模型,包括:
根据多个类型的伪量化节点对权重进行伪量化运算,并对输入参数和量化后的权重进行卷积操作,得到卷积结果;
对所述卷积结果进行偏置计算,对偏置结果进行激活操作得到激活结果,并对激活结果对应的特征图进行伪量化运算,以进行量化感知训练。
7.根据权利要求6所述的模型训练方法,其特征在于,所述根据当前类型的伪量化节点对权重进行伪量化运算,包括:
根据量化参数对所述权重进行量化运算得到量化值;
将所述量化值进行取整操作获取中间值,并根据所述量化参数对所述中间值进行反量化运算。
8.一种对象处理方法,其特征在于,包括:
获取待处理对象;
通过训练好的机器学习模型对所述待处理对象进行卷积操作,获取所述待处理对象对应的预测结果;其中,所述机器学习模型根据权利要求1-7中任意一项所述的模型训练方法训练得到。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210088006.3/1.html,转载请声明来源钻瓜专利网。





