[发明专利]一种具有尺度协调机制的实时视觉目标识别方法有效
| 申请号: | 201910340918.3 | 申请日: | 2019-04-25 |
| 公开(公告)号: | CN110211150B | 公开(公告)日: | 2023-04-18 |
| 发明(设计)人: | 王鸿鹏;宋玉琳;代婉 | 申请(专利权)人: | 南开大学 |
| 主分类号: | G06V20/40 | 分类号: | G06V20/40;G06T7/246;G06T7/277;G06T7/11;G06V10/25;G06V10/26;G06V10/50;G06V10/56;G06V10/52;G06V10/82;G06N3/0464;G06N3/08 |
| 代理公司: | 天津市尚仪知识产权代理事务所(普通合伙) 12217 | 代理人: | 高正方 |
| 地址: | 300071*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 具有 尺度 协调 机制 实时 视觉 目标 识别 方法 | ||
一种具有尺度协调机制的实时视觉目标识别方法,以目标分割确定待识别主体的大小,协调实时目标跟踪中待识别区域的尺度,从而提高识别精度。该方法首先对采集到的图像按对比度作图像分割,将待识别主体从背景中分割出来以确定待识别主体的大小。此外,在普通的实时视觉目标识别流程中,目标跟踪算法计算出每一帧中跟踪目标主体位置,并将主体位置提供给目标识别算法完成识别。当目标分割后的主体大小与目标跟踪后的主体大小之比高于阈值时,启动尺度协调机制,以目标分割大小为准,调整识别框基于跟踪框的扩大倍数。所提方法能够有效应对目标主体形变、旋转等问题。
技术领域
本发明涉及目标识别领域,尤其涉及一种具有尺度协调机制的实时视觉目标识别方法。
背景技术
随着计算机技术的发展,目标识别由于其在视频监控、场景理解、人机交互等方面具有很高的应用价值,成为了计算机领域的研究热点。视觉目标的实时识别技术涵盖目标定位与目标识别两个环节,其可以定义为,给定视频流中第一帧图像中感兴趣目标的矩形框,作为跟踪算法的输入,估计出所选目标在接下来每帧图像中的位置及大小,上述目标位置及大小再作为识别算法的输入,推理出待识别目标的所属类别。近年来,无论在目标跟踪领域还是目标识别领域均有大量改进算法被提出。
但在实际应用中,目标跟踪与目标识别对目标尺度的需求存在亟待解决的矛盾。具体表现为,对于目标跟踪环节,为尽可能减少背景噪声的引入,跟踪区域应尽可能不覆盖背景区域,因此给定感兴趣目标矩形框尽可能小时跟踪效果更好。而对于目标识别环节,待识别区域包含目标特征越多时识别精度越高,因此待识别目标矩形框尽可能大时识别精度更高。综上,为了在保证跟踪效果前提下尽可能提高识别精度,有必要对两个环节中目标区域尺度进行调整。
发明内容
本发明为解决目标跟踪与目标识别之间存在的矛盾,提出了一种基于目标分割的具有尺度协调机制的实时视觉目标识别方法。该方法首先对采集到的图像按对比度作图像分割,将待识别主体从背景中分割出来以确定待识别主体的位置及大小。此外,在普通的实时视觉目标识别流程中,目标跟踪算法计算每一帧中跟踪目标主体位置,并将主体位置提供给目标识别算法完成识别。当目标分割后的主体大小与目标跟踪后的主体大小之比高于阈值时,启动尺度协调机制,以目标分割大小为准,调整识别框基于跟踪框的扩大倍数,所提方法能够有效应对当目标主体形变、旋转等问题。
本发明的具体技术方案如下:
一种具有尺度协调机制的实时视觉目标识别方法,其步骤为:
步骤 1:采集图像,输入视频流序列;
步骤 2:目标检测,确定首帧感兴趣目标的位置与尺寸;
步骤 3:目标跟踪,分别提取目标区域内的 HOG 特征与颜色直方图特征,初始化跟踪器;
步骤 4:跟踪框,分别计算相关滤波跟踪器的响应、贝叶斯概率模型跟踪器的响应,将二者进行线性融合,综合响应最大的位置处,为目标的位置估计;引入单独的相关性滤波尺度估计机制,将不同尺度大小图像块统一到固定模板大小,寻找最优尺度估计,根据目标位置和尺度估计做出跟踪框;
步骤 5:目标识别,依据目标跟踪估计出的目标位置将待识别目标在原图像中裁剪出来,然后将待识别区域的尺寸归一化到自制数据集训练卷积神经网络CNN中输入尺寸参数,在训练好的 CNN 参数上进行一次前向传播得到推理结果作为识别框输出。
步骤 6:目标分割,每一帧图像在目标跟踪更新目标位置的同时,依据对比度分割出图像中的显著区域即为目标区域,在数字图像中通过计算每一个像素与周围的对比度来表示其显著性即属于目标的可能性,显著性越高则越可能属于目标,将显著性较高与较低区域分别以二值图像中的0和1表示,即完成目标分割,做出分割框;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910340918.3/2.html,转载请声明来源钻瓜专利网。





