[发明专利]基于SVM的摄像头运动参数估计方法有效
| 申请号: | 201210206007.X | 申请日: | 2012-06-20 |
| 公开(公告)号: | CN102737387A | 公开(公告)日: | 2012-10-17 |
| 发明(设计)人: | 孙美君;王语斌;江健民;王征 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06T7/20 | 分类号: | G06T7/20 |
| 代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 svm 摄像头 运动 参数估计 方法 | ||
所属技术领域
本发明属于计算机视频分析领域,涉及一种摄像头运动参数估计方法。
背景技术
近些年来,随着计算机技术的发展,大量的数字视频涌现。视频数据的分析越来越受到众人的关注。对于摄像机拍摄的视频数据,摄像机在拍摄过程中的运动参数,是视频数据本身的重要特征。该特征可以用于视频检索、视频分析、版权检测等领域。
目前对于摄像头运动参数估计技术,普遍采用的是一种成型的数学模型,在此数学模型的基础之上,通过分析视频数据中的相关特征,利用数学推导(如最小二乘法等),对模型进行回归,从而确定视频不同帧(frame)之间摄像头的运动参数。但是,这模型的准确度就无法得到证实,这些提取出的模型在数学处理过程中许多地方都是采取了经验的方法,因此这些模型的适应性本身只得怀疑。另外,由于视频分析需要处理大量的数据,对于处理速度也有较高的要求,因此在处理过程中如何通过筛选信息,在保证参数估计准确性的前提下,提高估计的效率,也是一个需要重点考虑的问题。
发明内容
本发明的目的是,克服现有技术的上述不足,提供一种能够在保证参数估计准确性的前提下提高估计效率的摄像头运动参数估计方法。本发明通过支持向量机(SVM)的强大的数学计算功能,对于压缩域的mpeg格式的视频数据,估计在拍摄该段视频数据时摄像头的运动参数,并且在保证结果准确的前提下,提高摄像头运动参数估计的速度。本发明的技术方案如下:
一种基于SVM的摄像头运动参数估计方法,包括下列步骤:
1)获取摄像头运动参数估计的训练数据真实值,得到支持向量机训练所需要的标定值;
2)对于mpeg格式视频,选取画面组里的P帧作为处理对象,从中选择采用帧间编码的宏块中存储的运动向量不为零的宏块作为宏块级的处理数据,从而得到支持向量机的训练数据;
3)将以上过程中得到的数据,转化成支持向量机可以识别的格式,设定好支持向量机的各种参数,其中核函数选择多项式,训练模型选择回归模式,对输入的训练数据进行多次迭代,得到训练好的支持向量机模型;
4)对于在现实世界中拍摄的视频片段,通过上述步骤2)中的筛选过程得到该视频片段的运动向量,将运动向量输入到已训练好支持向量机模型中,由支持向量机给出预测结果,实现对现实世界视频片段的运动参数估计。
本发明通过支持向量机得到的摄像头运动参数模型是可以重复利用的。因此,只需要一次训练就可以得到训练模型。此外,本发明中在压缩域中处理数据,并且对要处理的数据进行合理的筛选,大大缩减了所需处理的数据的规模,提高了运动参数估计的效率。
附图说明
图1Mpeg视频格式结构如图1;
图2本发明的程序流程图。
具体实施方式
下面首先说明本发明的技术方案。
1.获取摄像头运动参数估计的训练数据真实值,得到支持向量机训练所需要的标定值。
利用支持向量机估计数学模型必须有尽可能准确的训练数据。具体到摄像头运动参数估计这个问题,需要得到尽可能准确的摄像头运动参数的真实值。在本发明中,主要通过两种方法来获取。
1)3dmax软件可以建立3d的模型,并且可以人工的设定摄像头的运动参数,然后将整个摄像头运动过程中,背景和物体的图像录制成视频数据。而这些人工设定的运动参数可以通过文本的形式保存下来。利用编程语言稍微处理,便可以得到对应帧的摄像头的运动参数。
2)在没有3dmax软件的情况下,也可以采用傅立叶梅林变换(Fourier-Merlin Transform)的方法,得到两张图片的全局坐标变化。这种获取方法,首先要将视频的每一帧保存成图像,然后输入给傅立叶梅林程序。傅立叶梅变换程序会给出两幅图片的全局坐标变换值。对于视频中相邻两帧的全局左边变换可以作为摄像头运动参数估计的测试数据真值。
1.筛选所要处理的数据,并且最终得到支持向量机的训练数据
数据的筛选环节关系到摄像头运动参数估计的准确性和估计效率的问题,是整个技术方案的重要组成部分。
1)分析的视频是mpeg格式的视频
视频分析选择的数据格式是mpeg格式。Mpeg格式是一个很成熟的压缩视频存储格式。目前mpeg格式的视频有了很广泛的应用。本发明对视频数据的分析和处理直接在压缩域中进行操作的,这样避免了视频解压缩过程中的开销,大大减少的需要处理的数据量。
2)Mpeg格式视频的帧的选取
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210206007.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:消防高层供水保护器
- 下一篇:远程手动控制灭火器喷管





