[发明专利]对象识别模型的训练方法及装置在审
| 申请号: | 201911082558.8 | 申请日: | 2019-11-07 |
| 公开(公告)号: | CN112784953A | 公开(公告)日: | 2021-05-11 |
| 发明(设计)人: | 赵东悦;温东超;李献;邓伟洪;胡佳妮 | 申请(专利权)人: | 佳能株式会社;北京邮电大学 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06K9/62 |
| 代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 宿小猛 |
| 地址: | 日本*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 对象 识别 模型 训练 方法 装置 | ||
本公开涉及对象识别模型的训练方法及装置。提供了一种用于对象识别的神经网络模型的优化装置,包括:损失确定单元,被配置为对于利用所述神经网络模型从训练图像集中提取的特征和带有权重函数的损失函数确定损失数据,以及更新单元,被配置为基于所述损失数据和更新函数来执行神经网络模型的参数的更新操作,其中,所述更新函数是基于所述神经网络模型的带有权重函数的损失函数推导而得到的,所述权重函数与所述损失函数在特定取值区间中同向地单调变化。
技术领域
本公开涉及对象识别,特别涉及用于对象识别的神经网络模型。
背景技术
近年来,静态图像或一系列运动图像(诸如视频)中的对象检测/识别/比对/跟踪被普遍地和重要地应用于图像处理、计算机视觉和图案识别领域,并且在其中起到重要作用。对象可以是人的身体部位,诸如脸部、手部、身体等,其它生物或者植物,或者任何其它希望检测的物体。人脸/对象识别是最重要的计算机视觉任务之一,其目标是根据输入的照片/视频来识别或验证特定的人/对象。
近年来,用于人脸识别的神经网络模型、特别是深度卷积神经网络(CNNs)模型在显著提高性能方面取得了突破性进展。给定一个训练数据集,CNN训练过程利用通用的CNN架构作为特征提取器以从训练图像中提取特征,然后通过使用各种设计的损失函数来计算损失数据以用于监督训练CNN模型。所以当CNN架构选定后,人脸识别模型的性能由损失函数和训练数据集驱动。目前,Softmax损失函数及其变体(基于边界的Softmax损失函数)是人脸/对象识别中常用的监督函数。
但是应指出,训练数据集往往并不是理想的数据集,一方面是因为它们并不能充分地描述现实世界,另一方面是现有的训练数据集即使经过清洗仍然存在噪声样本。而对于这样的训练数据集,现有的Softmax损失函数及其变体无法取得理想的效果,无法有效地提高训练模型的性能。
因此,需要改进的技术来改善对象识别模型的训练。
除非另有说明,否则不应假定本节中描述的任何方法仅仅因为包含在本节中而成为现有技术。同样,除非另有说明,否则关于一种或多种方法所认识出的问题不应在本节的基础上假定在任何现有技术中都认识到。
发明内容
本公开的一个目的是改进用于对象识别的识别模型的训练优化。本公开的另一个目的是改进图像/视频的对象识别。
本公开提出了改进的用于对象识别的卷积神经网络模型的训练,其中在训练过程中动态控制用于卷积神经网络模型的优化/更新幅度,也被称为收敛梯度下降速度,使之能够自适应地匹配训练过程的进展,从而即使对于含有噪声的训练数据集,仍可获得高性能的训练模型。
本公开还提出了利用通过上述训练得到的模型来进行对象识别,从而进一步获得改进的对象识别结果。
在一个方面,提供了一种用于对象识别的神经网络模型的优化装置,包括:损失确定单元,被配置为对于利用所述神经网络模型从训练图像集中提取的特征和带有权重函数的损失函数确定损失数据,以及更新单元,被配置为基于所述损失数据和更新函数来执行神经网络模型的参数的更新操作,其中,所述更新函数是基于所述神经网络模型的带有权重函数的损失函数推导而得到的,所述权重函数与所述损失函数在特定取值区间中同向地单调变化。
在另一方面,提供了一种用于对象识别的神经网络模型的训练方法,包括:损失确定步骤,用于对于利用所述神经网络模型从训练图像集中提取的特征和带有权重函数的损失函数确定损失数据,以及更新步骤,用于基于所述损失数据和更新函数来执行神经网络模型的参数的更新操作,其中,所述更新函数是基于所述神经网络模型的带有权重函数的损失函数推导而得到的,所述权重函数与所述损失函数在特定取值区间中同向地单调变化。
在还另一方面,提供了一种包括至少一个处理器和至少一个存储设备,所述至少一个存储设备其上存储有指令,该指令在由所述至少一个处理器执行时可使得所述至少一个处理器执行如本文所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社;北京邮电大学,未经佳能株式会社;北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911082558.8/2.html,转载请声明来源钻瓜专利网。





