[发明专利]基于卷积神经网络的物体检测方法及装置有效
| 申请号: | 201811628757.X | 申请日: | 2018-12-28 |
| 公开(公告)号: | CN110309842B | 公开(公告)日: | 2023-01-06 |
| 发明(设计)人: | 贾纪元;周莉;陈杰 | 申请(专利权)人: | 中国科学院微电子研究所 |
| 主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/80;G06V10/778;G06V10/774 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 任岩 |
| 地址: | 100029 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 卷积 神经网络 物体 检测 方法 装置 | ||
1.一种基于卷积神经网络的物体检测方法,其特征在于,包括:
获取含物体的图片,将所述图片经数据扩增处理后输入至教师网络进行前向运算,得到具有不同通道特征信息的卷积特征图,所述教师网络为能够独立完成物体检测的卷积神经网络;
对所述卷积特征图进行聚合处理,得到通道信息聚合图;
根据感兴趣区域位置坐标,结合所述通道信息聚合图,产生区域重聚焦矩阵;
所述含物体的图片,进行相同的数据扩增处理后,同时输入学生网络进行前向运算得到卷积特征图,所述学生网络为规模小于所述教师网络的卷积神经网络;
利用所述区域重聚焦矩阵结合所述教师网络和学生网络的卷积特征图对学生网络进行缩放惩罚训练,直至学生网络的物体检测精度收敛;
将待检测的含有物体的图片输入学生网络,得到物体类别及位置信息。
2.根据权利要求1所述的基于卷积神经网络的物体检测方法,其特征在于,所述卷积特征图为含有不同维度的张量,所述维度包括:高度、宽度和通道。
3.根据权利要求1所述的基于卷积神经网络的物体检测方法,其特征在于,所述对所述卷积特征图进行聚合处理,得到通道信息聚合图包括:
在所述教师网络的卷积特征图的通道方向上,融合不同通道的语义信息,将不同通道特征信息聚合压缩为单通道矩阵,得到通道信息聚合图。
4.根据权利要求1所述的基于卷积神经网络的物体检测方法,其特征在于,所述产生区域重聚焦矩阵包括:
根据感兴趣区域的位置坐标,对所述通道信息聚合图裁剪出相应感兴趣区域的区域重聚焦矩阵,所述区域重聚焦矩阵编码了感兴趣区域内不同位置的重要程度。
5.根据权利要求1所述的基于卷积神经网络的物体检测方法,其特征在于,所述对学生网络进行缩放惩罚训练包括:
根据感兴趣区域的位置坐标,裁剪出教师网络和学生网络的卷积特征图中相应的特征张量,计算教师网络和学生网络的区域特征张量之间的欧氏距离,并用所述区域重聚焦矩阵加权所述欧氏距离,用加权后的距离构造辅助损失函数;
累加所述辅助损失函数和来自真值标签的检测损失函数构成联合损失函数;
根据所述联合损失函数,利用误差反向传播算法,计算学生网络中参数的梯度,利用梯度信息更新学生网络参数,直至学生网络的物体检测精度收敛。
6.根据权利要求5所述的基于卷积神经网络的物体检测方法,其特征在于,所述学生网络中参数为随机初始化或预训练权重初始化,所述预训练权重初始化是经过图像分类数据集预训练之后的权重参数。
7.根据权利要求1或4或5中任一所述的基于卷积神经网络的物体检测方法,其特征在于,所述感兴趣区域的位置坐标确定方法为:
根据数据集中所标注的边界框的位置坐标,将其位置坐标映射至所述通道信息聚合图,根据所述通道信息聚合图的实际分辨率对坐标进行缩放和整数化,使整数化的边界框坐标和卷积特征图进行匹配和对准,获得感兴趣区域位置坐标。
8.根据权利要求1或4所述的基于卷积神经网络的物体检测方法,其特征在于,所述区域重聚焦矩阵的计算公式为:
其中,mi,j∈S表示所生成的区域重聚焦矩阵中一个像素的值,i,j,k表示在三维的卷积特征图中一个像素的空间坐标,pi,j,k表示三维卷积特征图中某位置处的激活值,C代表三维卷积特征图的通道数,S表示某个感兴趣区域,T表示规范化因子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院微电子研究所,未经中国科学院微电子研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811628757.X/1.html,转载请声明来源钻瓜专利网。





