[发明专利]一种视频文件识别方法及装置有效

申请号：	201510683009.1	申请日：	2015-10-20
公开（公告）号：	CN106601243B	公开（公告）日：	2020-11-06
发明（设计）人：	谷长信	申请（专利权）人：	阿里巴巴集团控股有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G06K9/62
代理公司：	杭州君度专利代理事务所(特殊普通合伙) 33240	代理人：	诸佩艳
地址：	英属开曼群岛大开***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种视频文件识别方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种视频文件识别方法及装置，该方法首先从待识别视频文件中获取音频信息，通过对音频信息进行分段提取音频指纹，与训练样本进行音频匹配来判断是否是目标视频；然后对于无法确认的可疑视频文件，继续通过图像匹配来做进一步的识别。本发明的装置包括音频预处理模块、音频指纹匹配模块、音频判断模块、图像预处理模块、图像预处理模块和综合判断模块。本发明的方法及装置处理效率高，识别率高。

技术领域

本发明属于计算机数据处理技术领域，尤其涉及一种视频文件识别方法及装置。

背景技术

随着互联网的普及，越来越多用户开始利用互联网服务提供商提供的云服务器来存储个人的视频文件，一些互联网服务提供商还允许用户上传视频文件用来共享给网络中的其他用户。但是法律对于网上传播的视频文件有严格的审查要求，不能涉黄涉暴。因此互联网服务提供商有责任和义务对用户上传及服务商自己提供的视频文件按国家规范进行审核和监管。

现有技术对于视频文件的审核都是基于视频图像，通过抓取视频图像中的图片帧进行审核，存在如下问题：

处理效率低：视频图像抓帧范围无法有效定位，若想全面审核，抓帧量极大，处理效率低下；

识别手段单一，识别率不高：单一借助图片识别，存在漏识别和错误识别概率很高。

发明内容

本发明的目的是提供一种视频文件识别方法及装置，借助音频指纹识别和采用视频图像抓帧技术进一步进行图片识别，最终给出识别结果，有效提高处理效率。

为了实现上述目的，本发明技术方案如下：

一种视频文件识别方法，用于审核待识别视频文件，所述方法包括：

从待识别视频文件中获取音频信息；

将获取的音频信息进行分段，对分段后的音频分段进行指纹提取，得到音频分段的音频指纹；

将得到的音频分段的音频指纹与已经训练好的训练样本进行音频匹配，记录音频匹配结果；

根据音频匹配结果，判断待识别视频文件是否是目标视频，当判断为目标视频或判断为不是目标视频时，终止识别，当判断为可疑视频文件时，进入下一步继续识别；

根据音频匹配结果，从匹配成功的音频分段的起始时间开始对视频文件进行抓帧，抓取视频图像，对抓取的视频图像进行图像匹配，记录图片匹配结果；