[发明专利]一种视频检测方法及装置在审

申请号：	201510764366.0	申请日：	2015-11-10
公开（公告）号：	CN105389558A	公开（公告）日：	2016-03-09
发明（设计）人：	李邵梅;黄海;于洪涛;王凯;高超;黄雅静;李印海	申请（专利权）人：	中国人民解放军信息工程大学
主分类号：	G06K9/00	分类号：	G06K9/00
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	李金;王宝筠
地址：	450001 ***	国省代码：	河南;41
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种视频检测方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于图像识别技术领域，更具体的说，尤其涉及一种视频检测方法及装置。

背景技术

不良视频是指在传播形式或内容上存在非法或违规行为的视频。目前不良视频主要有两种类型：盗版视频以及其他类型的不良视频，其中其他类型的不良视频主要包括：反动视频、暴恐视频、诈骗视频和色情视频。这些不良视频借助公众网络广泛传播，已成为社会危害的重要诱因。

为了净化网络环境，研究人员提出了多种对不良视频进行检测的方法。其中针对盗版视频的检测研究相对较为成熟，针对反动视频、暴恐视频、诈骗视频和色情视频这类不良视频来说主要的检测方法是基于内容的检测方法，其处理过程如下：

首先获取不良视频中的视觉对象，并提取所述视觉对象的特征值作为匹配模板；其次在获得一个需要匹配的视频后，对所述视频中的每帧图像进行分区，并逐区提取每个分区的特征值；然后将每个分区的特征值与上述作为匹配模板的特征值进行基于距离的相似度计算，相似度小于指定阈值则判定视频为不良视频。但是视频是一个图像、文本和话音的集合，单纯通过图像检测来确定视频是否为不良视频可能会导致视频检测不准确。

发明内容

有鉴于此，本发明的目的在于提供一种视频检测方法及装置，用于提高视频检测的准确度。

本发明提供一种视频检测方法，所述方法包括：

基于待检测视频中相邻帧图像的相似度，将所述待检测视频分割成多个子段视频；

分别对各个子段视频进行图像检测、文本检测和话音关键词检测，得到各个子段视频的图像检测结果、各个子段视频的文本检测结果和各个子段视频的话音检测结果，其中所述图像检测结果用于指示基于图像检测得到的子段视频的检测结果，所述文本检测结果用于指示基于文本检测得到的子段视频的检测结果，所述话音检测结果用于指示基于话音关键词检测得到的子段视频的检测结果；

基于各个子段视频的图像检测结果、各个子段视频的文本检测结果和各个子段视频的话音检测结果，得到相应子段视频的检测结果；

基于各个子段视频的检测结果，得到所述待检测视频的检测结果。

优选地，所述基于各个子段视频的图像检测结果、各个子段视频的文本检测结果和各个子段视频的话音检测结果，得到相应子段视频的检测结果，包括：

当子段视频的图像检测结果、子段视频的文本检测结果和子段视频的话音检测结果中任意一项检测结果指示检测到目标对象，且目标对象的等级为一级时，得到指示所述子段视频为不良视频子段的检测结果；

当子段视频的图像检测结果、子段视频的文本检测结果和子段视频的话音检测结果中至少两项检测结果指示检测到目标对象，且目标对象的等级为二级时，得到指示所述子段视频为不良视频子段的检测结果，其中所述二级的重要程度小于所述一级的重要程度；

当子段视频的图像检测结果、子段视频的文本检测结果和子段视频的话音检测结果中任意一项检测结果指示检测到目标对象，且目标对象的等级为二级时，得到指示所述子段视频为疑似不良视频子段的检测结果。

优选地，所述基于各个子段视频的检测结果，得到所述待检测视频的检测结果，包括：

基于所述检测结果，得到为不良视频子段的第一子段视频数量以及疑似不良视频字段的第二子段视频数量；

当所述第一子段视频数量与子段视频总数的比例大于第一阈值时，得到指示所述待检测视频为不良视频的检测结果；

当所述第二子段视频数量与所述子段视频总数的比例大于第二阈值时，得到指示所述待检测视频为不良视频的检测结果，其中所述第一阈值小于第二阈值。

优选地，对子段视频进行图像检测，得到子段视频的图像检测结果，包括：

提取所述子段视频中每帧图像的检测区域的视觉特征；

将所提取的视觉特征与预先建立的图像对象模型进行匹配分析，以得到所述每帧图像中的不良对象和所述不良对象的等级，其中所述图像检测结果包括所述每帧图像中的不良对象和所述不良对象的等级。

优选地，对子段视频进行文本检测，得到子段视频的文本检测结果，包括：

确定所述子段视频中每帧图像中的文本区域；

对所确定的文本区域进行文本识别，得到所述文本区域包括的文本；

将得到的文本与预先建立的文本库进行匹配，以得到所述每帧图像中的不良文本和所述不良文本的等级，其中所述文本检测结果包括所述每帧图像中的不良文本和所述不良文本的等级。

优选地，对子段视频进行话音检测，得到子段视频的话音检测结果，包括：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国人民解放军信息工程大学，未经中国人民解放军信息工程大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201510764366.0/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种视频检测方法及装置在审

专利文献下载