[发明专利]检测视频图像中的目标的方法和装置无效
| 申请号: | 200910161669.8 | 申请日: | 2009-07-28 |
| 公开(公告)号: | CN101968884A | 公开(公告)日: | 2011-02-09 |
| 发明(设计)人: | 梅树起;吴伟国 | 申请(专利权)人: | 索尼株式会社 |
| 主分类号: | G06T7/00 | 分类号: | G06T7/00 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 康建峰;郎晓虹 |
| 地址: | 日本*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 检测 视频 图像 中的 目标 方法 装置 | ||
1.一种检测视频图像中的目标的方法,包括:
帧检测步骤:对包含目标帧的多帧图像分别进行检测,以得到一个或多个第一候选目标及其置信度;及
合并步骤:对所述多帧图像中的第一候选目标及其置信度进行合并,得到目标帧中的一个或多个第二候选目标。
2.如权利要求1所述的方法,其中,所述帧检测步骤包括:
第一遍历步骤:利用第一窗口以第一步长对所述多帧图像中的每帧图像进行遍历,对每个窗口图像进行检测以得到一个或者多个第三候选目标及其置信度;
第一遍历结果合并步骤:将位置相邻、尺寸相近的第三候选目标及其置信度合并,以得到所述第一候选目标及其置信度。
3.如权利要求2所述的方法,其中,所述帧检测步骤还包括:
关注区域建立步骤:根据所述第一遍历结果合并步骤的结果,建立一个或多个关注区域,每个关注区域覆盖相应的第三候选目标;
第二遍历步骤:利用第二窗口以第二步长对每个关注区域进行遍历,对每个窗口图像进行检测以得到一个或者多个第四候选目标及其置信度;
第二遍历结果合并步骤:将位置相邻、尺寸相近的第三候选目标和第四候选目标及其置信度合并,以得到所述第一候选目标及其置信度。
4.如权利要求2所述的方法,其中,所述第一遍历步骤包括:
帧金字塔建立步骤:建立每帧图像的多尺度金字塔图像,该多尺度金字塔图像包括K层,K>1;
第三遍历步骤,利用所述第一窗口以所述第一步长对所述金字塔图像中的每个进行遍历,对每个窗口图像进行检测以得到一个或者多个第三候选目标及其置信度。
5.如权利要求4所述的方法,其中:
所述第三遍历步骤是从所述金字塔图像中最小尺寸的图像开始处理的,并且还包括:
掩模建立步骤:基于对第一到第N金字塔图像的检测结果而建立一个或多个目标掩模,每个目标掩模对应于相应的第三候选目标,
其中,在对其余K-N个图像进行处理时,不对所述K-N个图像中与各目标掩模对应的区域进行遍历,其中1≤N<K。
6.如权利要求3所述的方法,其中
所述关注区域建立步骤之后,所述方法还包括:建立每个关注区域的多尺度金字塔图像,
所述第二遍历步骤包括:利用所述第二窗口以所述第二步长对每个关注区域的金字塔图像进行遍历,对每个窗口图像进行检测以得到一个或者多个第四候选目标及其置信度。
7.如权利要求1所述的方法,其中,所述合并步骤包括:将所述多帧图像中的位置相邻尺寸相近的第一候选目标的置信度合并。
8.如权利要求7所述的方法,其中,将所述多帧图像中位置相邻尺寸相近的第一候选目标的置信度合并包括:对所述多帧图像中的位置相邻尺寸相近的第一候选目标的置信度求和或平均值,或者对所述多帧图像中的位置相邻尺寸相近的第一候选目标的置信度进行归一化并对归一化后的置信度求和或求平均值。
9.如权利要求1所述的方法,其中,所述帧检测步骤是利用包括多个子分类器的目标检测和分类器进行的,每个子分类器能够检测一类目标。
10.如权利要求9所述的方法,还包括:根据输出最大置信度的子分类器所对应的类别,来确定目标的类别。
11.一种检测视频图像中的目标的装置,包括:
目标检测与分类器,用于对视频序列中包括目标帧的多帧图像进行检测,以得到一个或多个第一候选目标及其置信度;
合并模块,用于对所述多帧图像中的第一候选目标的置信度进行合并,以得到目标帧中的一个或多个第二候选目标。
12.如权利要求11所述的装置,还包括遍历模块,
所述遍历模块用于利用第一窗口以第一步长对每个图像进行遍历,并将每个窗口图像输出到所述目标检测与分类器,以得到一个或多个第三候选目标及其置信度,
所述合并模块还用于将位置相邻尺寸相近的第三候选目标的置信度合并,以得到所述第一候选目标及其置信度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于索尼株式会社,未经索尼株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910161669.8/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





