[发明专利]目标检测系统中基于注意力机制定位损失计算方法及系统有效
| 申请号: | 201810102737.2 | 申请日: | 2018-02-01 |
| 公开(公告)号: | CN108205687B | 公开(公告)日: | 2022-04-01 |
| 发明(设计)人: | 刘阳;孔祥斌;李洪研;张涛;沈志忠;陈树俊 | 申请(专利权)人: | 通号通信信息集团有限公司 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 徐宁;孙楠 |
| 地址: | 100070 北京市丰台区南*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 目标 检测 系统 基于 注意力 机制 定位 损失 计算方法 | ||
本发明涉及一种目标检测系统中基于注意力机制的定位损失计算方法及系统,其包括:在卷积神经网络的正向目标检测过程中,利用注意力机制计算用于生成目标预测框的卷积图的权重矩阵;确定预测框中心点横坐标、中心点纵坐标、横向宽度以及纵向高度各自单独的偏差所导致的其与目标框非重叠的区域;根据注意力机制获得的卷积图的权重矩阵中,位于预测框与目标框在卷积图上非重叠的区域的元素的权重,计算定位损失;计算反向误差传播中定位损失对于预测框、目标框与权重矩阵的梯度;判断卷积神经网络的迭代过程是否结束,否则返回前述步骤,是则结束。本发明能提高目标检测精确性,并能有效节省人力、物力和时间成本。
技术领域
本发明涉及一种模式识别领域中计算机视觉方向的目标检测方法及系统,特别是关于一种目标检测系统中基于注意力机制的定位损失计算方法及系统。
背景技术
在近年来目标检测领域的Faster-RCNN、SSD等基于卷积神经网络经典算法中,在网络正向目标检测的最后阶段,已经获知系统对物体位置的预测框(predicted bounding-box)tu和训练数据中的目标框(ground-truth bounding-box)v之后,普遍采用函数来计算目标定位损失Lloc(tu,v)。从而可以在反向误差传播阶段,利用链式求导法则,根据Lloc(tu,v)在每层网络节点和链路处的梯度,修正网络中的链路权重和卷积核数值,通过上述迭代过程完成对卷积神经网络的训练。
其中,对于属于类别u的物体,i∈{x,y,w,h}代表对于预测框tu和目标框v的比较是基于4个参数进行的:中心点横坐标x;中心点纵坐标y;横向宽度w;纵向高度h。系统将这4个维度的代价直接相加,就可以得到目标定位损失的数值。函数的表达式如下:
在反向误差传播的过程中,位于系统输出部分的函数利用公式(3)和公式(4)分别对预测框tu和目标框v求偏导数,以获得其对于这两个参数的梯度,并使用链式求导法则将该梯度数值依次传递给前面的所有层:
其中,sign()代表符号函数。
上述定位损失计算方法利用预测框tu相对于目标框v的偏差,指导反向误差传播中对于网络参数的修正。由式2-4可见,函数属于典型的分段函数,在自变量(即预测框tu和目标框v中心点横坐标x、中心点纵坐标y、横向宽度w、纵向高度h的差值)绝对值小于1时表现为二次非线性函数,其对于自变量的变化相对不敏感;反之,在自变量绝对值大于1的区域,其表现为一次线性函数,其对自变量的变化比较敏感。这样做的目的是使得系统对于已经定位的比较精确的预测框tu相对于目标框v的偏差造成的损失不敏感,其在反向误差传播中对于网络相关参数修正的影响也较小,系统将更加重视定位得非常不精确的预测框tu的定位偏差,并主要根据其造成的损失来修正网络相关参数,最终保证系统对于网络参数迭代优化的效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于通号通信信息集团有限公司,未经通号通信信息集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810102737.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:视频情感分类方法及装置
- 下一篇:一种新型高速口取卡机





