[发明专利]一种基于语音识别的视频文件处理方法在审

申请号：	202010308388.7	申请日：	2020-04-18
公开（公告）号：	CN111356022A	公开（公告）日：	2020-06-30
发明（设计）人：	徐琼琼;陈海清	申请（专利权）人：	徐琼琼
主分类号：	H04N21/472	分类号：	H04N21/472;H04N21/44;H04N21/439;G10L15/22;G10L15/02
代理公司：	郑州芝麻绘智知识产权代理事务所(普通合伙) 41191	代理人：	符亚飞
地址：	450000 ***	国省代码：	河南;41
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于语音识别视频文件处理方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种基于语音识别的视频文件处理方法，接收视频播放语音指令，对视频播放语音指令进行语音识别，得到播放指令文本数据，将播放指令文本数据与预设的视频播放指令专用词典进行比对，确定是否为有效文本数据，若为有效文本数据，则将有效文本数据转换为视频播放控制指令，以控制启动视频播放应用，播放视频文件，在视频文件播放过程中，提取视频文件的各个视频图像帧以及视频文件的音频数据，分别对视频图像帧和音频数据进行处理，得到该视频文件的人脸图像库和音频库，最后输出人脸图像库和音频库。通过该视频文件处理方法能够有效可靠地提取出视频文件中的人脸图像以及音频关键字，实现视频文件的可靠处理，得到所需的数据信息。

技术领域

本发明涉及一种基于语音识别的视频文件处理方法。

背景技术

目前，视频处理技术的应用越来越广泛。在视频处理领域，很多情况下需要对视频文件进行处理，获取到视频文件中的相关数据信息，现有的视频处理方法无法对视频文件进行可靠处理。

发明内容

本发明的目的在于提供一种基于语音识别的视频文件处理方法，用于解决现有的视频处理方法无法对视频文件进行可靠处理的问题。

为了解决上述问题，本发明采用以下技术方案：

一种基于语音识别的视频文件处理方法，包括：

接收视频播放语音指令；

对所述视频播放语音指令进行语音识别，得到播放指令文本数据；

将所述播放指令文本数据输入到预设的视频播放指令专用词典进行比对，若所述播放指令文本数据中存在所述视频播放指令专用词典中的至少一个词语，则判定所述播放指令文本数据为有效文本数据；

将所述有效文本数据转换为视频播放控制指令；