[发明专利]一种智能视频监控方法有效
申请号: | 201410372651.3 | 申请日: | 2014-07-31 |
公开(公告)号: | CN104144328A | 公开(公告)日: | 2014-11-12 |
发明(设计)人: | 陈国顺;杨毅;夏明飞;牛刚;吕贵州;张东;韩宁;牛满科 | 申请(专利权)人: | 中国人民解放军63908部队 |
主分类号: | H04N7/18 | 分类号: | H04N7/18;G10L15/06;G10L25/57;G06T7/20 |
代理公司: | 北京律谱知识产权代理事务所(普通合伙) 11457 | 代理人: | 王庆海 |
地址: | 050000 *** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 视频 监控 方法 | ||
1.一种智能视频监控方法,其包括:
a)同步采集共计T秒的视频数据信号和音频数据信号,并将视频数据信号按照连续多帧图像数据的形式保存,将音频数据信号按照wav的形式保存;
b)将图像数据划分为训练图像数据和测试图像数据以及将音频数据划分为训练音频数据和测试音频数据;
c)判断训练音频数据和测试音频数据中是否包含异常音频数据,如果有,提取出异常音频数据并另行保存,否则进行下一步;
d)对全部训练图像数据和测试图像数据以及包括异常音频数据在内的全部训练音频数据和测试音频数据分别进行预处理,并且对预处理后的全部训练图像数据和测试图像数据进行检测和提取所有运动目标帧像素,对预处理后的音频数据提取音频特征;
e)对经预处理后及运动目标帧像素提取后的全部训练图像数据建立全局背景模型;
f)对经预处理后及音频特征提取后的全部训练音频数据中的异常音频数据建立新的高斯混合模型;
g)将步骤e得到的全局背景模型参数和步骤f得到的高斯混合模型参数融合构建一个联合决策模型,用该联合决策模型对预处理后的全部测试数据进行异常状态判别。
2.根据权利要求1所述的智能视频监控方法,其中在步骤a)中,T=100秒。
3.根据权利要求1所述的智能视频监控方法,其中在步骤b)中,对于T秒连续的图像数据,选取从头开始共计T1秒的连续图像数据作为训练图像数据,其它图像数据作为测试图像数据,其中0<T1<T/2,同样的,对于T秒连续的音频数据,选取从头开始也为T1秒的连续音频数据作为训练音频数据,其它音频数据作为测试音频数据,其中0<T1<T/2。
4.根据权利要求1所述的智能视频监控方法,其中在步骤c)中,所述异常音频数据是指突发枪声、人尖叫声、或汽车报警声。
5.根据权利要求1所述的智能视频监控方法,其中在步骤d)中,所述对图像数据的预处理包括降噪处理,所述对音频数据的预处理包括预加重、分帧加窗、和端点检测。
6.根据权利要求1所述的智能视频监控方法,其中在步骤d)中所述检测和提取所有运动目标帧像素的方法如下:
检测每个图像是否存在运动目标帧的方法为:将当前帧之前的连续100帧灰度图像的平均值作为当前帧的背景图像,其中若不够100帧则按照实际帧数的灰度图像的平均值作为当前帧的背景图像,将当前帧和其背景图像相减,得到背景减后的帧间差灰度矩阵,如果此矩阵的全部数值的绝对值的和小于设定的阈值,则认为当前帧中无运动目标;如果此矩阵的全部数值的绝对值的和大于所述设定的阈值,则认为当前帧中有运动目标;
提取运动目标帧像素的方法是:将运动目标帧对应的背景减后的帧间差灰度矩阵中其数值大于所述设定的阈值的值用1替代,将其他小于所述设定的阈值的值用0替代,从而获得一个二值的帧间差矩阵,每个帧间差矩阵作为对应图像的运动目标帧像素;
所述提取音频特征是提取梅尔频率倒谱系数。
7.根据权利要求6所述的智能视频监控方法,其中所述设定的阈值是0.01*当前帧像素个数之和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军63908部队,未经中国人民解放军63908部队许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410372651.3/1.html,转载请声明来源钻瓜专利网。