[发明专利]一种广告视频检测方法有效

申请号：	201210214583.9	申请日：	2012-06-26
公开（公告）号：	CN102799633A	公开（公告）日：	2012-11-28
发明（设计）人：	王建超	申请（专利权）人：	天脉聚源(北京)传媒科技有限公司
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	暂无信息	代理人：	暂无信息
地址：	100007 北京市东***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种广告视频检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及视频检测与视频检测技术领域，尤其涉及一种广告视频检测方法。

背景技术

随着信息时代的发展，作为商业信息的主要载体和传播媒介，广告视频在人们的日常生活的信息交互中占据着越来越重要的作用。对于普通的视频浏览人员来说，他们对广告视频没有兴趣。因此他们可以借助广告检测系统，可以迅速的定位到广告视频部分，从而可以进行相关的操作，比如删除一段视频节目中对于他们毫无意义的广告视频部分，从而保留电视节目内容。这样一方面可以节省他们观看视频的时间，另一方面也可以节省存储视频数据的空间。但是面对如此浩瀚的视频数据，如何快速的检测和过滤相关的广告视频段的问题亟需解决。因此人们提出了广告视频检测系统，利用它可以自动的快速定位广告视频段。经过近些年的研究，广告视频检测从最初的简单的基于black/silent(黑色/无声)帧发展到现今的基于镜头特征的检测，从最初的仅仅考虑视觉方面的特征检测发展到如今的音频和视频特征相结合的检测。

针对广告视频和普通节目视频之间的特征区别，人们提出了很多的广告检测算法。根据检测算法基于的特征不同，现在的比较实用的广告视频系统的检测算法大体上可以分成以下两类：

(1)基于标识的方法(Logo-based methods)

此方法是最早的广告视频检测方法。该方法主要利用电视台的台标进行检测。电视台在播放普通电视节目时会将自己的台标显示出来，而播放广告时一般就会隐去台标，这使得我们可以通过检测台标的存在与否来区分广告视频和普通电视节目视频。台标一般分为三种：静态台标、半透明台标和动态台标。针对不同形态的台标，都有相应的检测方法，从而实现对广告视频的检测。其中对于静态台标的研究是比较深入的，而且应用得很广泛。但是对于半透明台标和动态台标，检测起来比较困难，所以还没有比较成熟的检测方法。另外，现在很多电台在播放广告视频的时候也会将台标显示出来，这时基于标识的检测方法就会失效。

(2)基于规则的方法(Rule-based methods)

基于规则的方法大多是利用广告镜头的信息来进行检测的，它是通过一组特征和规则来区分广告和普通电视节目视频。由于广告视频和普通电视节目视频在某些特征方面存在着比较明显的差异，因此利用这些区分性比较强的特征，就可以实现对广告视频的检测。在视频方面可以通过提取一段视频帧的平均边缘变化率A-ECR(Average of Edge Change Ratio)和边缘变化方差V-ECR(Variance of Change Ratio)以及平均帧差A-FD(Average of Frame Difference)和帧方差V-FD(Variance of Frame Difference)来实现检测。在音频方面，广告视频的音频内容和普通电视节目的音频内容也存在一些明显的特征上的区别，比如可以利用音频多维频率普系数(Mel-frequency Cepstral Coefficient)和音频信息熵来实现对广告视频的分割检测。但是在以往的研究中音频方面的特征一般都用于辅助视频特征检测方面，通过两者的结合才能实现对广告段更加精确的分割检测。

发明内容

本发明的目的是在于提出一种广告视频检测方法，能够大量减少视频检测和编辑领域的工作人员的工作量，提高视频检测速度和检测的精确度。

本发明提供了一种广告视频检测方法，包括以下步骤：

步骤A、提取不少于一个的广告视频和不少于一个的非广告视频，建立视频训练集，提取每个视频的不少于一个的音频特征，将所有所述音频特征作为输入样本进行支持向量机训练；

步骤B、输入待检测视频，提取待检测视频的不少于一个的音频特征；

步骤C、输入待检测视频的音频特征使用完成训练的支持向量机进行计算并输出计算结果；

步骤D、根据所述计算结果判断视频检测结果，将所述检测结果输出。

进一步地，步骤A和步骤B中，提取视频的不少于一个的音频特征，还包括以下步骤：

使用解码工具对视频进行解码，得到视频图像集合和音频信息，将所述音频信息以数组形式保存；

将所述视频图像集合分割为不少于一个的镜头，提取每个镜头的音频特征；

进一步地，所述将所述视频图像集合分割成不少于一个的镜头，还包括以下步骤：

提取所有视频图像的颜色直方图，计算两个相邻视频图像的颜色直方图的相似值，作为帧间相似值；