[发明专利]一种视频检测方法及装置在审
申请号: | 201510764366.0 | 申请日: | 2015-11-10 |
公开(公告)号: | CN105389558A | 公开(公告)日: | 2016-03-09 |
发明(设计)人: | 李邵梅;黄海;于洪涛;王凯;高超;黄雅静;李印海 | 申请(专利权)人: | 中国人民解放军信息工程大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李金;王宝筠 |
地址: | 450001 *** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 检测 方法 装置 | ||
技术领域
本发明属于图像识别技术领域,更具体的说,尤其涉及一种视频检测方法及装置。
背景技术
不良视频是指在传播形式或内容上存在非法或违规行为的视频。目前不良视频主要有两种类型:盗版视频以及其他类型的不良视频,其中其他类型的不良视频主要包括:反动视频、暴恐视频、诈骗视频和色情视频。这些不良视频借助公众网络广泛传播,已成为社会危害的重要诱因。
为了净化网络环境,研究人员提出了多种对不良视频进行检测的方法。其中针对盗版视频的检测研究相对较为成熟,针对反动视频、暴恐视频、诈骗视频和色情视频这类不良视频来说主要的检测方法是基于内容的检测方法,其处理过程如下:
首先获取不良视频中的视觉对象,并提取所述视觉对象的特征值作为匹配模板;其次在获得一个需要匹配的视频后,对所述视频中的每帧图像进行分区,并逐区提取每个分区的特征值;然后将每个分区的特征值与上述作为匹配模板的特征值进行基于距离的相似度计算,相似度小于指定阈值则判定视频为不良视频。但是视频是一个图像、文本和话音的集合,单纯通过图像检测来确定视频是否为不良视频可能会导致视频检测不准确。
发明内容
有鉴于此,本发明的目的在于提供一种视频检测方法及装置,用于提高视频检测的准确度。
本发明提供一种视频检测方法,所述方法包括:
基于待检测视频中相邻帧图像的相似度,将所述待检测视频分割成多个子段视频;
分别对各个子段视频进行图像检测、文本检测和话音关键词检测,得到各个子段视频的图像检测结果、各个子段视频的文本检测结果和各个子段视频的话音检测结果,其中所述图像检测结果用于指示基于图像检测得到的子段视频的检测结果,所述文本检测结果用于指示基于文本检测得到的子段视频的检测结果,所述话音检测结果用于指示基于话音关键词检测得到的子段视频的检测结果;
基于各个子段视频的图像检测结果、各个子段视频的文本检测结果和各个子段视频的话音检测结果,得到相应子段视频的检测结果;
基于各个子段视频的检测结果,得到所述待检测视频的检测结果。
优选地,所述基于各个子段视频的图像检测结果、各个子段视频的文本检测结果和各个子段视频的话音检测结果,得到相应子段视频的检测结果,包括:
当子段视频的图像检测结果、子段视频的文本检测结果和子段视频的话音检测结果中任意一项检测结果指示检测到目标对象,且目标对象的等级为一级时,得到指示所述子段视频为不良视频子段的检测结果;
当子段视频的图像检测结果、子段视频的文本检测结果和子段视频的话音检测结果中至少两项检测结果指示检测到目标对象,且目标对象的等级为二级时,得到指示所述子段视频为不良视频子段的检测结果,其中所述二级的重要程度小于所述一级的重要程度;
当子段视频的图像检测结果、子段视频的文本检测结果和子段视频的话音检测结果中任意一项检测结果指示检测到目标对象,且目标对象的等级为二级时,得到指示所述子段视频为疑似不良视频子段的检测结果。
优选地,所述基于各个子段视频的检测结果,得到所述待检测视频的检测结果,包括:
基于所述检测结果,得到为不良视频子段的第一子段视频数量以及疑似不良视频字段的第二子段视频数量;
当所述第一子段视频数量与子段视频总数的比例大于第一阈值时,得到指示所述待检测视频为不良视频的检测结果;
当所述第二子段视频数量与所述子段视频总数的比例大于第二阈值时,得到指示所述待检测视频为不良视频的检测结果,其中所述第一阈值小于第二阈值。
优选地,对子段视频进行图像检测,得到子段视频的图像检测结果,包括:
提取所述子段视频中每帧图像的检测区域的视觉特征;
将所提取的视觉特征与预先建立的图像对象模型进行匹配分析,以得到所述每帧图像中的不良对象和所述不良对象的等级,其中所述图像检测结果包括所述每帧图像中的不良对象和所述不良对象的等级。
优选地,对子段视频进行文本检测,得到子段视频的文本检测结果,包括:
确定所述子段视频中每帧图像中的文本区域;
对所确定的文本区域进行文本识别,得到所述文本区域包括的文本;
将得到的文本与预先建立的文本库进行匹配,以得到所述每帧图像中的不良文本和所述不良文本的等级,其中所述文本检测结果包括所述每帧图像中的不良文本和所述不良文本的等级。
优选地,对子段视频进行话音检测,得到子段视频的话音检测结果,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军信息工程大学,未经中国人民解放军信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510764366.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:预应力钢储罐
- 下一篇:大面积被栓式瓷砖干挂施工方法