[发明专利]一种快速鲁棒的近相同视频检测和排除方法有效
申请号: | 200910077182.1 | 申请日: | 2009-01-20 |
公开(公告)号: | CN101464909A | 公开(公告)日: | 2009-06-24 |
发明(设计)人: | 孙立峰;徐辉;刘璐;杨士强 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京清亦华知识产权代理事务所 | 代理人: | 廖元秋 |
地址: | 1000*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 快速 相同 视频 检测 排除 方法 | ||
技术领域
本发明属于信息挖掘技术领域,涉及一种在大规模网络视频数据库中进行近相同视频的检测和排除的方法。
背景技术
近年来,随着互联网技术的发展,特别是普通用户可以访问的带宽快速增长,越来越多的以视频为主的多媒体应用成为互联网的热点。它们在信息检索,数字娱乐方面有着极好的交互特性,大大丰富了人们的互联网体验。现在,人们可以轻松地从互联网上得到大量的视频信息,网络视频内容在变得丰富多彩的同时,同时也存在大量的冗余信息,特别是热点视频的重复上传,很多网络视频包含的内容基本一致,但是由于编码率,编码质量,颜色变换,后期人工编辑以及帧率的不同,需要用基于内容的方法来比较排除,这些视频被称为近相同视频。近相同视频的存在给网络存储带来了极大的浪费,以往解决这一的方法大致有三类,分别是基于全局特征,镜头(shot)级特征,是基于特征点的图像区域级特征的检测方法。总而言之,全局特征如利用视频颜色直方图等,具有特征简单,计算量较少的优点,但只适用于检测内容几乎相同的视频。镜头级特征可以检测到经过较多编辑的视频,最近出现了以特征点检测比如SIFT等匹配方法,可以更准确得进行相似度衡量。但是这些方法不是生成特征的计算量过高,匹配方法过于复杂。由于网络视频数量庞大,这些大量存在的近相同内容对视频检测和排除算法具有较高的性能要求,因此设计快速鲁棒的方法来进行近相同视频的检测排除变得势在必行。
发明内容
本发明的目的是为克服已有技术的不足之处,设计出一种快速鲁棒的近相同视频检测和排除方法,本方法在分析视频特征的基础上先给每个视频生成相应的基于关键帧的准确鲁棒的签名信息,然后通过对抽象出来的签名信息进行匹配,用于大规模网络视频数据库中的近相同视频的检测和排除取,具有更高的速度和理想的结果。
本发明提出的一种快速鲁棒的近相同视频检测和排除方法,包括对待检测视频的关键帧特征进行提取,生成的视频全局特征的视频特征生成阶段,比较待检测视频的全局特征向量和已有视频的全局特征向量完成近相同视频的检测的模式匹配阶段,所述视频特征生成阶段,包括对关键帧图像分块,提取出各块平均灰度作为关键帧特征,并用主分量分析方法(PCA)对关键帧特征进行二值化量化,基于量化后的关键帧特征,生成全局特征。
上述方法,主要包括以下步骤:
(1)生成待检测视频的关键帧;
(2)对该关键帧进行分块,得到该关键帧的平均灰度特征向量;
(3)对得到的平均灰度特征向量利用主分量分析方法降低该灰度特征向量的维度;
(4)利用海量图片的统计结果得到的平均值作为阈值对该降维后的平均灰度特征向量进行二值化量化;
(5)利用二值化量化后的基于关键帧平均灰度特征向量,生成待检测视频的全局特征向量;
(6)比较待检测视频的全局特征向量和已有视频的全局特征向量,排除数据库中与该待检测视频特征差异较大的已有视频;
(7)对数据库中用全局特征不能排除的视频,利用基于视频关键帧级特征向量间的相似度建立二分图;
(8)用最大匹配近似算法计算该二分图最大匹配值,将该最大匹配值与阈值Th比较,再次排除数据库中与该待检测视频差异较大的已有视频;
(9)将不能排除的视频的二分图修改为带有源结点、汇结点的一般图,用图切分算法计算得到该图的最大匹配值,并用该匹配值作为阈值完成近相同视频的检测。
本发明的特点及效果:
本发明提出的在大规模网络视频数据库中进行近相同视频排除的方法,用于对大规模网络视频的内容监控。本方法对视频进行特征重构,维度约减的有效表示。简单的灰度特征能有效保留图片的大部分信息,相同的分块方式能给不同解析度的关键帧带来比较的统一度量。主成分分析的方法进一步地保留了关键帧的主要特征,保持了最大部分的相似性,同时由于采用了从大量图片进行统计量化的方法,直接提取出最能代表关键帧级特性的二进制特征,极大地方便了后期计算机处理,保证了高效的处理速度。同时本发明采取了关键帧级特征生成全局特征,这样全局和局部特征并用的分层检测方法,能够快速发现非近相同视频,避免了后期较大的计算负担。可以预见,这种方法可以广泛地应用于网络视频存储,索引并可以用于搜索引擎搜索结果重排序的后处理阶段,同时本发明的方法也为近相同视频的检测提供了一个实际可行的框架,便于融合具有更少计算复杂度,更高区分度的图像特征。
具体实施方式
本发明提出的一种快速鲁棒的近相同视频检测和排除方法,结合实施例详细说明如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910077182.1/2.html,转载请声明来源钻瓜专利网。