[发明专利]一种针对二维图像序列中多尺度多形态目标的自动检测方法在审
| 申请号: | 202011451531.4 | 申请日: | 2020-12-10 |
| 公开(公告)号: | CN112365498A | 公开(公告)日: | 2021-02-12 |
| 发明(设计)人: | 袁杰;孙英;蒋玉婷;彭成磊 | 申请(专利权)人: | 南京大学 |
| 主分类号: | G06T7/00 | 分类号: | G06T7/00;G06N3/04;G06N3/08 |
| 代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 胡建华 |
| 地址: | 210008 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 针对 二维 图像 序列 尺度 形态 目标 自动检测 方法 | ||
本发明公开了一种针对二维图像序列中多尺度多形态目标的自动检测方法。包括以下步骤:改变原始二维图像尺寸并对目标进行标定;根据二维图像序列的堆叠形成三维数组,进而获得另一平面的图像并对其目标进行标定;用目标检测神经网络分别训练两个平面的数据集,尽可能保证较高的召回率,得到二维图像预测的检测结果;将目标平面上的检测结果投影至辅助平面得到的框位置与辅助平面网络预测的检测框进行对比,判断两者交集程度,根据辅助平面的预测检测结果去除二维图像预测检测中出现的假正例;最后利用图像中目标的灰度连续性进一步去除假正例,并将图像恢复至原始尺寸,通过上述步骤综合两个平面的信息得到准确率较高的目标检测结果。
技术领域
本发明涉及图像分析和目标检测技术领域,尤其是涉及一种针对二维图像序列中多尺度多形态目标的自动检测方法。
背景技术
目标检测广泛存在于人脸识别、手势识别、医学检测等任务中,是机器视觉领域最基础、最重要的技术之一。目标检测包括候选区域提取和目标类别判别两个步骤,其中目标类别判断是各种检测方法之间的主要差别所在。目前对于二维图像序列的目标检测,主要有人为构造特征,并使用规则匹配、支持向量机等方法进行分类识别的传统检测方法;以及使用卷积神经网络等深度学习方法。主要有以下不利因素:
1)当前已有的目标检测方法在用于目标与非目标具有相似形态表现的场景中时,会错误地将非目标区域检测为目标而导致高假正例。
2)人工构造特征往往受目标图像尺度和形态多变性等因素困扰,很多情况下检测效果并不理想,鲁棒性不高。
3)卷积神经网络端到端的学习方式解决了人工构造特征鲁棒性不高的缺陷,但对于连续的二维图像,普通的深度学习方式忽略了图像连续这一特点,无法有效利用图像的上下文信息,因而检测的准确性还有待进一步提升。
发明内容
发明目的:本发明所要解决的技术问题是针对二维图像序列中多尺寸多形态目标检测如何有效利用其图像连续这一特点的问题,基于深度学习中的卷积神经网络,提出了一种结合另一维度信息来辅助判断二维图像序列上多尺寸多形态目标的方法,实现了对目标更精确的检测。
本发明公开了一种基于卷积神经网络并结合另一维度信息的针对二维图像序列中多尺寸多形态目标的自动检测方法,包括如下步骤:
步骤1,改变原始二维图像尺寸,将其长宽比扩大一倍,得到使待检测目标长宽比扩大一倍的图像,对图像中的目标进行标定,得到真实标定框,将目标标定后的图像存入数据集D1;
步骤2,将同一场景下连续的一组二维图像在第三维上进行堆叠,每一组二维图像都构成一个三维数组,用该三维数组构造出一组在另一辅助平面上连续的二维图像;
步骤3,将辅助平面的边缘无效像素裁去,对经过裁剪后辅助平面图像中的目标进行标定,得到真实标定框,将辅助平面上目标标定后的图像存入数据集D2;所述无效像素指辅助平面上目标可能出现的最远位置以外的部分;
步骤4,分别将数据集D1、D2按照合适的比例划分为训练集和测试集,分别在D1、D2的训练集上使用目标检测神经网络进行训练,用训练好的目标检测模型对D1、D2的测试集进行测试,得到目标平面和辅助平面的预测检测结果;
步骤5,将目标平面上的检测结果投影至辅助平面得到的框位置与辅助平面的预测检测结果进行对比,判断两者交集程度,以此辅助平面的检测结果辅助判断目标平面的检测结果,去除目标平面检测框中的假正例,所述假正例指预测为目标,实际为非目标的检测框;
步骤6,根据目标在二维图像序列中的灰度连续性这一特点,进一步去除目标平面检测框中的假正例;
步骤7,将图像恢复至原始尺寸,就完成了对二维图像序列中多尺寸多形态目标的检测,最终得到低假正例的更加精确的检测结果。
在一种实现方式中,步骤2包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011451531.4/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





