[发明专利]基于先进音视频编码标准的视频监控方法及系统无效
申请号: | 200810203202.0 | 申请日: | 2008-11-21 |
公开(公告)号: | CN101419670A | 公开(公告)日: | 2009-04-29 |
发明(设计)人: | 王新;路红;宋元征;陈桂财 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;H04N7/18 |
代理公司: | 上海正旦专利代理有限公司 | 代理人: | 陆 飞;盛志范 |
地址: | 20043*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 先进 视频 编码 标准 监控 方法 系统 | ||
1.一种基于AVS的视频监控方法,其特征在于具体步骤如下:首先通过AVS网络摄像机采集AVS码流,使用AVS码流解码过程中的压缩域信息来进行背景和非背景的分类;当分类结果表明当前的帧不是背景时,进行人脸检测;当检测到人脸时,进行人脸识别,即将人脸数据进行变换后与训练数据进行比较;在识别结果被反馈给用户之前,先计算置信度t,t表明当前识别结果的可信程度;当置信度t小于阈值t_min时,认为该人脸不属于当前库中的数据,认定为陌生人,并将这个结果反馈给用户,经用户确认后将此新的人脸添加进库中;当置信度大于等于阈值t_min时,表明识别结果有较高的可信度,然后记录识别结果并对视频进行标注;这里AVS是指先进音视频编码标准。
2.根据权利要求1所述的方法,其特征在于所述背景分类的方法为设 i为当前图像中的一个宏块的运动向量, 0≤i≤N-1;N为当前图像中宏块总数;
用下式来计算当前图像中的运动强度:
公式(1)
其中,sizei表示第i个宏块的面积;
参数MS表示图像中运动的范围:
公式(2)
当满足下列条件时,判定当前图像属于背景:
MV<mv_min且MS<ms_min;这里mv_min为MV的阈值,ms_min为MS的阈值。
3.根据权利要求1所述的方法,其特征在于所述的人脸识别的方法如下:从人脸检测中检测出的人脸图像进行尺寸统一缩放后,按照由左至右,由上至下扫描成样本向量,然后对样本向量进行降维;采用PCA与LDA结合的Fisher-Face算法进行人脸投影特征的抽取;
设人脸f经过Fisher-Face特征抽取后的样本向量为f’,f’=(u0,u1…uk),然后计算其与训练样本的距离:
公式(3)
其中fi’=(v0,v1…vk)表示库中的第i个训练样本,k为样本维数;d(f’,fi’) 表示当前待识别样本与库中第i个训练样本的距离;
计算完f’与库中所有训练样本的距离后,找出与f’距离最小的前5个训练样本,fi1’,fi2’…fi5’;所述5个训练样本中同一类别数量较多的样本所属类别为c类;若5个样本各属一类,则以与f’距离最小的样本所属类作为c类,所述c类任指属于同一个人的样本类;用下列公式计算识别的置信度t:
公式(4)
当置信度t小于阈值t_min时,说明人脸为陌生人,将结果f反馈给用户,经用户确认后将此新的人脸添加进库中,否则表示识别结果可靠并记录结果。
4.一种基于AVS的视频监控系统,其特征在于系统包括训练模块、标注模块和检索模块:
所述训练模块,包括监控环境背景的背景训练模块和人脸库的人脸训练模块,分别实施对环境背景训练和对人脸训练;所述训练模块的输入为人脸样本库和背景样本库,输出为各人脸特征和背景特征;
所述标注模块,用于对输入的监控视频进行自动标注,其包括背景检测模块、人脸检测模块、人脸识别模块和索引结构建立模块;所述标注模块的输入为训练模块得到的背景特征、人脸特征和待标注的监控视频,输出为待标注监控视频的检索索引;
所述检索模块,用于对指定监控视频进行检索,包括图片查询、文本查询和视频查询;输入为指定监控视频的索引,用户提交的图片、文本或小段视频,输出为用户所提交内容在监控视频中相应的视频片段信息;
所述背景训练模块,用于对输入的背景视频样本进行计算,得到背景模型,采用算法是基于HSV颜色空间,计算各像素属于背景的取值范围;所述背景训练模块的输入为背景视频样本,输出为用于背景比对的背景模型;
所述人脸训练模块,用于对人脸库中的人脸进行处理,采用算法是fisher-face;所述人脸训练模块的输入为人脸库样本,输出为由人脸库中人脸样本计算得到的变换矩阵以及各人脸的中心,所述变换矩阵将输入人脸样本变换为一维向量;
所述背景检测模块,用于将输入帧图像与所述背景模型进行比对,目的是获知该输入帧是否为背景,若不是背景,则输入帧属于前景范围;所述背景检测模块的输入为背景模型和输入帧图像,输出为判断该输入帧是否为背景的结果;
所述人脸检测模块,用于在非背景的帧图像中检测人脸;所述人脸检测模块的输入为 非背景的帧图像,输出为检测到的人脸图像;
所述人脸识别模块,用于对于检测到的人脸图像,使用所述变换矩阵,得到一维向量,采用欧式距离计算该向量与各人脸中心的相似度;所述人脸识别模块的输入为检测到的人脸图像和变换矩阵,输出为人脸识别的结果;
所述索引结构建立模块,用于对输入视频进行标注,依照人脸识别的结果,得到视频索引,并对索引建立索引结构;所述索引结构建立模块的输入为监控视频,输出为视频索引;
所述检索模块,用于使用户通过用户界面输入查询内容,根据用户提交的不同的内容格式进行检索,并通过用户界面反馈信息;所述检索模块的输入为用户提交的查询内容,
输出为反馈给用户的视频片断信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810203202.0/1.html,转载请声明来源钻瓜专利网。