[发明专利]训练图像识别模型的方法和装置以及图像识别方法和装置在审
申请号: | 201910583821.5 | 申请日: | 2019-06-28 |
公开(公告)号: | CN111062405A | 公开(公告)日: | 2020-04-24 |
发明(设计)人: | 李元熙;孙旼廷;郑景夫;张现盛 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 黄亮 |
地址: | 韩国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 图像 识别 模型 方法 装置 以及 | ||
公开了训练图像识别模型以准确地估计每类地标的参考点的位置的装置和方法。该装置和方法使用图像识别模型,该图像识别模型是基于以下来训练的:基于图像识别模型根据训练数据来计算类别损失和依赖于类别的定位损失;以及使用包括类别损失和定位损失在内的总损失来训练图像识别模型。
相关申请的相交引用
本申请要求于2018年10月17日向韩国知识产权局递交的韩国专利申请No.10-2018-0123487的优先权,该申请的全部公开内容通过引用并入本文中以用于所有目的。
技术领域
以下描述涉及训练图像识别模型。
背景技术
图像识别的自动化已经通过作为专门的计算架构的处理器实现的神经网络模型来实现,该处理器实现的神经网络模型在经过大量训练之后可以提供输入模式与输出模式之间在计算上直观的映射。经训练的生成这种映射的能力可以被称为神经网络的学习能力。此外,由于专门的训练,这种经特殊训练的神经网络因此可以具有针对输入模式(该输入模式是该神经网络可能未曾被训练以识别的输入模式)来生成相对准确的输出的推广能力。然而,由于这些操作或应用是通过专门的计算架构来执行的,并且采用与以非计算机实现或非自动化方法执行这些操作或应用不同的自动化方式来执行,因此这些操作或应用也会引起问题或缺陷,这些问题或缺点仅因为在其上实施这些操作或应用的自动化的且专门的计算架构而出现。
发明内容
提供了本发明内容以介绍下面在具体实施方式中进一步描述的对简化形式的构思的选择。本发明内容不意在标识所请求保护的主题的关键特征或必要特征,也不意在用作帮助确定所请求保护的主题的范围。
在一个一般方面中,提供了一种训练图像识别模型的方法,包括:基于图像识别模型根据训练数据来计算类别损失和依赖于类别的定位损失;以及使用包括所述类别损失和所述定位损失在内的总损失来训练所述图像识别模型。
计算所述类别损失和所述依赖于类别的定位损失可以包括:基于所述图像识别模型根据输入训练图像来计算临时类别信息和临时参考点信息;基于所述临时类别信息和真实类别信息来计算所述类别损失;以及基于所述临时参考点信息和真实参考点信息来计算所述定位损失。
计算所述临时类别信息和所述临时参考点信息可以包括:计算所述输入训练图像的每个子区域的临时类别信息和临时参考点信息。
计算所述类别损失可以包括:计算所述真实类别信息和针对输入训练图像的每个所述子区域来计算的所述临时类别信息之间的部分类别损失;以及将针对所述输入训练图像的每个所述子区域所计算的部分类别损失的总和确定为所述类别损失。
计算所述类别损失可以包括:从输入训练图像的子区域中选择与真实地标部分相对应的子区域;计算所述真实类别信息和针对每个所选子区域来计算的临时类别信息之间的部分类别损失;以及将针对所选子区域计算的部分类别损失的总和确定为所述类别损失。
选择所述子区域可以包括:从输入训练图像的子区域中进一步选择与真实背景部分相对应的子区域。
计算所述定位损失可以包括:针对输入训练图像的每个所述子区域,计算所述真实参考点信息和针对输入训练图像的每个所述子区域来计算的临时参考点信息之间的部分定位损失;以及将针对每个所述子区域来计算的部分定位损失的总和确定为所述定位损失。
计算所述定位损失可以包括:从输入训练图像的子区域中选择与真实地标部分相对应的子区域;计算所述真实参考点信息和每个所选子区域的临时参考点信息之间的部分定位损失;以及将针对所选子区域计算的部分定位损失的总和确定为所述定位损失。
计算所述部分定位损失可以包括:从所选子区域中排除具有真实背景部分的子区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910583821.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序