[发明专利]一种基于局部时空流形学习的运动目标分割方法有效
申请号: | 201210187511.X | 申请日: | 2012-06-07 |
公开(公告)号: | CN102750712A | 公开(公告)日: | 2012-10-24 |
发明(设计)人: | 林倞;江波;徐元璐;梁小丹 | 申请(专利权)人: | 中山大学 |
主分类号: | G06T7/20 | 分类号: | G06T7/20 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 局部 时空 流形 学习 运动 目标 分割 方法 | ||
技术领域
本发明涉及视频监控领域,具体涉及运动目标分割技术,光照不变性特征的提取,局部时空流形离线学习,运动目标与背景分割,局部时空流形在线更新维护等领域。
技术背景
目前,以视频监控为核心的公共场合安防系统正在大幅度的推广,不同于传统的人力式视频监控带来的巨大的人力花费和可能出现的大量误报漏报的问题,智能视频监控以其直观、准确、及时和信息内容丰富而越来越受到业界的关注和推广。近年来,随着计算机性能、网络的飞速发展,在原来智能监控中存在的计算瓶颈,传输瓶颈得以突破。复杂的、效果高的智能监控技术正在逐渐取代原有的简单的、注重运行效率的传统智能监控技术。运动目标分割,作为智能视频监控的一项基础型技术,一直都是大量的研究机构的关注的重点。
运动目标分割技术的主要目的是排除监控视频中的背景对高层次的智能视频监控技术(运动目标跟踪,跨线检测,行为识别等)造成的干扰。其基本的方法是通过对监控视频中的背景提取特征,然后使用统计/概率模型进行背景建模。当视频中新来一帧后,通过判断图像能否被背景模型表达来判断是否出现了前景物体并分割出来。
传统的运动目标分割方法,如多高斯(GMM),直接相减法,背景均值图像法等,均基于监控视频中的场景基本静止(且摄像头不会发生抖动),无突然的光照变化等等的基本假定,这也就决定了他们的适用范围固定在一些室内的简单场景下。而随着视频监控的不断推广,越来越多的室外复杂场景,传统的运动目标分割方法已经无法满足视频智能分析的需求。
当下的监控视频中,常存在以下的几个问题:
1、动态背景,如监控视频场景中出现的随风摇摆的树木,喷泉,水面,天气变化(雨,雪)等,此时简单的背景模型无法对动态背景中所有可能出现的情况进行充分的表示。
2.、光照变化,如室内场景的开关灯,摄像头的自动光补偿,均会造成视频在全局层面上出现大幅度的变化。
3、摄像头抖动,受客观条件影响,拍摄监控视频的摄像头难免会出现一定的抖动,这一部分对于目前的运动目标跟踪而言是一个巨大的难题,尚没有一种较好的方法能够简单且有效的解决该问题。
为了解决上述的问题1和2,许多改进的运动目标分割技术被提出。从背景模型的类型来分,大致可以分为以像素点为基础的分割,以图像块为基础的分割,以时空立方体为基础的分割三类。
以像素点为基础的分割,其基本思想在于为每个像素点在整个监控视频中维护若干个简单的概率模型。但是不同于传统方法简单的使用像素值作为建模的样本,当下的以像素点为基础的运动目标分割技术一般使用局部的纹理编码(LBP)来描述一个像素点在其所处的局部空间内的特征。此类特征一般仅记录当前像素点与其临域像素点的像素值的相对大小,也就相当于记录了这一块区域的纹理变化规律,这样在发生光照变化的时候相对像素值大小基本保持不变,从而提高对视频中的动态场景和光照变化的描述能力,此类方法最近的研究发表在2010年CVPR上”Modeling pixel process with scale invariant local patterns for backgroundsubtraction in complex scenes”。以像素点为基础的分割技术特点在于算法简单运行效率较高,但是因为局部的纹理特征仅能描述极为简单的变化,而在较为复杂的动态背景和光照变化的视频中,此类方法的效果较差。
以图像块为基础的分割,不同于以像素点为基础的分割,通过使用固定大小的图像块作为背景模型的基础单元,使用主成分分析(Principle Component Analysis),判别式模型(Generalized 1-SVM)等来描述背景。这类方法在很多较为复杂的场景中效果较好,但是存在着两个局限性:1.对于时间较长的监控视频,很多模型会出现明显的退化现象。2.图像块的基本假设将视频从时间和空间上分离,对时空上变化上的表达不够全面。此外,缺少一种以图像块为基础的局部纹理特征,故此类方法对光照变化较为敏感。
以时空立方体为基础的分割,在图像块的基础上更进一步,通过从视频中分割出一个个的时空立方体,并假定每个时空立方体描述了背景在视频中一个简单的时空变化来对背景进行建模。常见的模型为稀疏字典表达(Sparse Coding),时空显著性(Spatiotemporal Saliency)。以时空立方体为基础的分割能够很好描述动态背景在视频中的变化,当然,与之对应是模型复杂度和计算量的增加。与图像块为基础的分割类似的是,对于如何使用一种特征描述时空立方体中的纹理统计量,尚未有人提出方法。故此类方法如何能够提高在光照变化的效果有待研究。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210187511.X/2.html,转载请声明来源钻瓜专利网。