[发明专利]基于多特征提取和多任务融合的目标检测算法在审
申请号: | 201711038002.X | 申请日: | 2017-10-30 |
公开(公告)号: | CN107886117A | 公开(公告)日: | 2018-04-06 |
发明(设计)人: | 娄英欣;郭晓强;王琳;夏治平;姜竹青;门爱东 | 申请(专利权)人: | 国家新闻出版广电总局广播科学研究院;北京邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/32;G06K9/34 |
代理公司: | 天津盛理知识产权代理有限公司12209 | 代理人: | 王利文 |
地址: | 100886 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 提取 任务 融合 目标 检测 算法 | ||
1.一种基于多特征提取和多任务融合的目标检测算法,其特征在于包括以下步骤:
步骤1、基于深度学习卷积神经网络架构提取图像特征,提取多层卷积输出结果形成多特征图,并在多特征图上提取不同可视野的目标感兴趣区域,对提取的目标感兴趣区域进行特征连接;
步骤2、对原图实现语义分割提取目标分割区域结果,并将目标检测结果和目标分割结果在全连接层中通过一定的比例系数进行多任务交叉辅助目标检测;
步骤3、上述结果通过最后的全连接层后,通过组合分类定位损失函数对图像特征进行分类和回归定位,得到最终目标检测的结果。
2.根据权利要求1所述的基于多特征提取和多任务融合的目标检测算法,其特征在于:所述深度学习卷积神经网络架构为VGG-16卷积神经网络架构。
3.根据权利要求1或2所述的基于多特征提取和多任务融合的目标检测算法,其特征在于:所述步骤1的具体实现方法包括以下步骤:
⑴将带有物体真实包围框的图片输入到目标检测卷积神经网络架构中,使用Caffe框架提取图像并通过卷积神经网络输出的不同层的图像特征;
⑵隔层提取出多层卷积层的输出并进行连接形成多特征的特征图,第一个卷积层输出卷积特征最大池化,最后一个卷基层输出卷积特征反卷积,使两个卷积层的输出特征尺寸与中间卷积层的输出特征尺寸大小一致,连接多层卷积层的输出图像特征形成多特征图;
⑶在多特征图上,对于生成的可能包含物体的目标感兴趣区域,进行不同倍数的区域缩放,得到不同的目标感兴趣区域,然后将不同的目标感兴趣区域进行连接形成最终的目标感兴趣区域。
4.根据权利要求3所述的基于多特征提取和多任务融合的目标检测算法,其特征在于:所述⑵隔层提取出多层卷积层的输出并进行连接形成多特征的特征图的方法为:基于深度学习VGG-16卷积神经网络架构提取图像特征,提取其中第1层、第3层和第5层卷积输出结果形成多特征图,并在特征图上提取目标感兴趣区域面积的1、2和3倍特征区域,得到不同可视野感兴趣区域,并对提取结果进行特征连接。
5.根据权利要求1或2所述的基于多特征提取和多任务融合的目标检测算法,其特征在于:所述步骤2的具体实现方法以下步骤:
⑴将带有物体真实包围框的图片输入到目标分割卷积神经网络架构中,提取卷积神经网络的输出结果;
⑵按照目标检测比例系数为0.7及目标分割比例系数为0.3融合目标检测结果和目标分割结果,实现输出结果交叉连接功能;
⑶将最后一层全连接层的结果输出到下一模块。
6.根据权利要求1或2所述的基于多特征提取和多任务融合的目标检测算法,其特征在于:所述步骤3的具体实现方法包括以下步骤:
⑴通过Softmax分类损失函数算法对图像特征进行分类,基于目标检测的公开标准数据集,每类物体具有自己相应的精度;
⑵通过Overlap定位损失函数算法对图像位置进行定位,使得目标检测生成的包围物体的候选框更加接近物体输入的真实包围框;
⑶根据Softmax输出的分类损失值进行排序,选出得分最高的类别,作为该物体最有可能属于哪一个类别;
⑷根据Overlap输出的定位损失值反向传播梯度,使得损失值逐渐下降,实现物体候选框更加接近物体的真实包围框。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家新闻出版广电总局广播科学研究院;北京邮电大学,未经国家新闻出版广电总局广播科学研究院;北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711038002.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:翘曲板材搬送物流系统
- 下一篇:一种液晶基板吸附装置的吸盘组件