[发明专利]卷积神经网络模型的训练方法及装置有效
| 申请号: | 201710274339.4 | 申请日: | 2017-04-25 |
| 公开(公告)号: | CN107194464B | 公开(公告)日: | 2021-06-01 |
| 发明(设计)人: | 万韶华 | 申请(专利权)人: | 北京小米移动软件有限公司 |
| 主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 林锦澜 |
| 地址: | 100085 北京市海淀区清河*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 卷积 神经网络 模型 训练 方法 装置 | ||
本公开是关于一种卷积神经网络模型的训练方法及装置,属于图像处理技术领域,该方法包括:通过待训练的卷积神经网络模型对存储的多个训练图像分别进行识别处理,得到多个预测类别概率向量。对于该多个训练图像中的每个训练图像,确定该训练图像的预测类别概率向量与初始类别概率向量之间的差值,得到该训练图像的类别概率误差向量。由于该初始类别概率向量中包括多个初始类别概率是基于预设扰动概率、该训练图像的真实类别以及对应类别的类别比例确定得到,如此,在基于多个训练图像的类别概率误差向量和该多个训练图像对卷积神经网络模型进行训练时能够加快算法收敛速度,从而保证了训练后的卷积神经网络模型对图像识别的准确性。
技术领域
本公开涉及图像处理技术领域,尤其涉及一种卷积神经网络模型的训练方法及装置。
背景技术
随着图像处理技术的快速发展,卷积神经网络模型在图像识别方面得到了广泛的应用,譬如,如果将一张待识别的图像输入至已完成训练的卷积神经网络模型中,通过该卷积神经网络模型可以识别出该图像的类别。例如,将一张“猫”的图像输入至已完成训练的卷积神经网络模型中,通过该卷积神经网络模型可以识别出该图像的类别为“猫”。为了能够成功实现图像识别,通常需要预先基于大量的训练图像对卷积神经网络模型进行训练,例如,预先基于大量的动物训练图像对卷积神经网络模型进行训练。目前,如何对卷积神经网络模型进行训练以保证图像识别的准确性成为本领域研究的热点。
发明内容
为克服相关技术中存在的问题,本公开提供一种卷积神经网络模型的训练方法及装置。
第一方面,提供一种卷积神经网络模型的训练方法,所述方法包括:
通过待训练的卷积神经网络模型对存储的多个训练图像分别进行识别处理,得到多个预测类别概率向量,每个预测类别概率向量中包括多个预测类别概率,每个预测类别概率为对应的训练图像属于多个预设类别中每个预设类别的概率;
对于所述多个训练图像中的每个训练图像,确定所述训练图像的预测类别概率向量与初始类别概率向量之间的差值,得到所述训练图像的类别概率误差向量,所述初始类别概率向量中包括多个初始类别概率,所述多个初始类别概率是基于预设扰动概率、所述训练图像的真实类别以及对应类别的类别比例确定得到;
基于所述多个训练图像的类别概率误差向量和所述多个训练图像,对所述卷积神经网络模型进行训练。
可选地,确定所述训练图像的预测类别概率向量与初始类别概率向量之间的差值之前,还包括:
对于所述多个预设类别中的每个预设类别,确定所述预设类别的类别比例;
基于所述预设扰动概率、所述训练图像的真实类别以及所述预设类别的类别比例,通过如下公式确定与所述预设类别对应的初始类别概率;
P(k)=λ*δy(k)+(1-λ)*p0(k);
其中,所述P(k)表示与所述预设类别对应的初始类别概率,λ表示所述预设扰动概率,所述p0(k)表示所述预设类别的类别比例,其中,当所述训练图像的真实类别与所述预设类别相同时,所述δy(k)为1,当所述训练图像的真实类别与所述预设类别不同时,所述δy(k)为0。
可选地,基于所述多个训练图像的类别概率误差向量和所述多个训练图像,对所述卷积神经网络模型进行训练,包括:
确定所述多个训练图像的类别概率误差向量的平均类别概率误差向量;
基于所述平均类别概率误差向量和所述多个训练图像,对所述卷积神经网络模型进行训练。
可选地,基于所述平均类别概率误差向量和所述多个训练图像,对所述卷积神经网络模型进行训练,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710274339.4/2.html,转载请声明来源钻瓜专利网。





