[发明专利]一种卷积神经网络训练方法、图像识别方法和装置在审
| 申请号: | 202010529092.8 | 申请日: | 2020-06-11 | 
| 公开(公告)号: | CN111680795A | 公开(公告)日: | 2020-09-18 | 
| 发明(设计)人: | 王世安 | 申请(专利权)人: | 广州工程技术职业学院 | 
| 主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 | 
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 沈闯 | 
| 地址: | 510000 *** | 国省代码: | 广东;44 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 卷积 神经网络 训练 方法 图像 识别 装置 | ||
本申请公开了一种卷积神经网络训练方法、图像识别方法和装置,其中卷积神经网络训练方法包括:获取待训练的卷积神经网络;将测度损失和软最大损失结合,构建卷积神经网络训练时的类信息和节点结构的学习损失函数,基于反向传播算法和随机梯度下降法,通过学习损失函数对卷积神经网络进行训练。节点结构和类信息的丢失可以加快训练的收敛速度,同时保持或提高训练精度,故本申请中以节点结构和类信息作为训练时的训练指标,同时结合将测度损失和软最大损失构建训练卷积神经网络时的学习损失函数,解决了现有的卷积神经网络训练方法,在面对小型的卷积神经网络时,难以适用的技术问题。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种卷积神经网络训练方法、图像识别方法和装置。
背景技术
随着人工智能技术的发展,卷积神经网络在图像识别及语音识别等领域体现出强大优势。在进行识别的过程中,首先根据不同的识别需求,对卷积神经网络进行训练得到卷积神经网络模型,然后通过卷积神经网络模型进行对应的识别。
现有技术中对卷积神经网络的训练方法,主要是针对训练集图像的类信息进行的,该训练方法在面对小型的卷积神经网络(卷积层数不超过10层)时,难以适用。
发明内容
有鉴于此,本申请提供了一种卷积神经网络训练方法、图像识别方法和装置,解决了现有的卷积神经网络训练方法,在面对小型的卷积神经网络时,难以适用的技术问题。
本申请第一方面提供了一种卷积神经网络训练方法,包括:
获取待训练的卷积神经网络;
将测度损失和软最大损失结合,构建所述卷积神经网络训练时的类信息和节点结构的学习损失函数,其中,所述学习损失函数为:
L=βLmetric+(λ-β)Lsoft max;
式中,L为学习损失函数,β为损失的重量,Lmetric为测度损失,λ为软最大损失和测度损失的重量之和,Lsoft max为软最大损失;
基于反向传播算法和随机梯度下降法,通过所述学习损失函数对所述卷积神经网络进行训练。
可选地,所述卷积神经网络包括:两个第一卷积单元、三个第二卷积单元和两个完全连接单元;
所述第一卷积单元包括:卷积层、池化层、激活层、退出层和规范化层和卷积脱落层;
所述第二卷积单元包括:卷积层、激活层、退出层和规范化层和卷积脱落层。
可选地,所述测度损失的计算过程包括:
获取训练阶段时,由第一完全连接单元的第一输出构成的第一输出集合,所述第一输出集合为:其中,xi为第i个第一输出,N为第一输出集合中第一输出的个数;
获取类信息的对应图像构成的对应图像集合,所述对应图像集合为其中,yi'为第i'个对应图像,N'为对应图像集合中的对应图像个数;
根据所述第一输出和所述对应图像,构建所述测度损失对应的损失函数;
其中,所述测度损失对应的损失函数为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州工程技术职业学院,未经广州工程技术职业学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010529092.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种交易验证方法及装置
 - 下一篇:一种地形分类方法及装置
 





