[发明专利]一种基于深度卷积神经网络的目标分类及姿态检测方法有效
| 申请号: | 201710010558.1 | 申请日: | 2017-01-06 |
| 公开(公告)号: | CN106683091B | 公开(公告)日: | 2019-09-24 |
| 发明(设计)人: | 刘明;杜浩源;董立泉;赵跃进;刘小华;惠梅;孔令琴 | 申请(专利权)人: | 北京理工大学 |
| 主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/04 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100081 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明属于图像处理与目标检测领域,公开了一种基于深度卷积神经网络的目标分类及姿态检测方法。所述方法核心内容包括:1.样本集的制作方法;2.候选窗口生成方法;3.特征提取方法;4.网络训练方法;5.目标标注方法。待检测图像经过卷积神经网络得到深度卷积特征后,将具备姿态角的候选窗口映射到该特征层上,得到方向性的区域特征向量,通过该特征向量进行分类和预测得到最终的检测结果。该方法能够从样本中提取更加纯净的目标特征,可提高分类的正确率,并且能够实现目标姿态角检测功能。 | ||
| 搜索关键词: | 一种 基于 深度 卷积 神经网络 目标 分类 姿态 检测 方法 | ||
【主权项】:
1.一种基于深度卷积神经网络的目标分类及姿态检测方法,其特征在于包括以下步骤:a)制作样本集,包括训练集和测试集,每张样本图像可包含多个目标,每个目标用六个参数(l,x,y,h,w,θ)进行表示,l代表该目标的标签,x和y代表目标中心在图像中的横纵坐标,h和w代表目标真值窗口的高和宽,θ表示目标相对于基准轴的姿态角;b)候选窗口生成过程,在整幅图像上以一定步长均匀生成候选窗口,窗口采用不同尺寸和不同姿态角的矩形框;c)深度特征提取过程,先将待检测的图像输入到预先训练的模型进行计算得到深度卷积特征图,将b)当中生成的候选窗口依据图像金字塔的机制映射到深度卷积特征图上面生成固定维度的特征向量;d)子网络构建过程,在获得的卷积特征层的基础上,构建三个子网络分别用于识别目标种类、修正候选窗口位置和预测目标姿态角,对于网络中新添加的层,采用Xavier初始化方法建立参数;e)训练样本的生成过程,样本中不仅包含图像,还包含候选窗口的正负样本,正负样本依据候选窗口与真值窗口的重叠比例IOU进行划分,使样本集中正负样本比例接近于1:1;f)网络训练过程,通过批量随机梯度下降法对网络参数进行调整,每次训练需至少输入一幅图像,保证正样本数量的前提下随机抽取负样本,在训练起始阶段通过较大学习率对参数进行更新,在网络输出误差减小缓慢时减小学习率;g)目标标注步骤,输入一幅待检测图像,利用训练完成的网络进行计算,得到候选窗口的类别、位置偏移量、姿态角和分数,设定阈值排除分数较低的窗口,通过极大值抑制方法保留分数较高的窗口作为最终检测结果,利用具备姿态角的矩形窗口框选目标位置。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710010558.1/,转载请声明来源钻瓜专利网。





