[发明专利]基于语音识别的视频生成方法、系统、装置和存储介质在审

申请号：	201910846382.2	申请日：	2019-09-09
公开（公告）号：	CN110781328A	公开（公告）日：	2020-02-11
发明（设计）人：	呼伦夫	申请（专利权）人：	天脉聚源(杭州)传媒科技有限公司
主分类号：	G06F16/532	分类号：	G06F16/532;G06F16/732;G10L15/26
代理公司：	44205 广州嘉权专利商标事务所有限公司	代理人：	黎扬鹏
地址：	310000 浙江省杭州市***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音信息视频信息图片信息文字特征视频素材文字信息解析视频存储介质检索模型快速制作人工检索视频生成视频数据视频制作语音识别自动识别预设搜集节约制作应用图片
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种基于语音识别的视频生成方法、系统、装置和存储介质，其中方法包括以下步骤：获取语音信息，并对语音信息进行识别后生成为文字信息；对文字信息进行解析后，获得文字特征；结合文字特征和预设的检索模型获取图片信息和/或视频信息；结合语音信息以及图片信息和/或视频信息生成视频数据。本发明根据用户输入的语音信息进行自动识别和解析，并根据解析获得的文字特征获取到图片信息和/或视频信息，无需人工检索搜集图片或视频素材，极大地节约了视频素材收集时间，提高了制作视频的效率，达到快速制作视频的效果，可广泛应用于视频制作领域。

技术领域

本发明涉及视频制作领域，尤其涉及一种基于语音识别的视频生成方法、系统、装置和存储介质。

背景技术

随着互联网技术及自媒体的发展，出现很多视频平台和对应的视频软件，比如今日头条、西瓜视频以及抖音等，同时也产生了很多网络红人和自媒体博主。博主通过制作视频在视频软件上播放，获取点击量和吸引粉丝关注，比如通过制作电影点评视频或者时事点评视频等。博主在制作视频时，既要撰写稿词，又得收集图片或视频素材，所以制作一个视频需要花费较多的时间，严重影响了制作视频的效率。目前，博主们迫切希望有相应的方案帮助提高视频制作效率，然而目前尚没有相应的方案。

发明内容

为了解决上述技术问题，本发明的目的是提供一种能够基于语音识别快速制作视频的方法、系统、装置和存储介质。

本发明所采用的第一技术方案是：

一种基于语音识别的视频生成方法，包括以下步骤：

获取语音信息，并对语音信息进行识别后生成为文字信息；

对文字信息进行解析后，获得文字特征；

结合文字特征和预设的检索模型获取图片信息和/或视频信息；

结合语音信息以及图片信息和/或视频信息生成视频数据。

进一步，所述对文字信息进行解析后，获得文字特征这一步骤，具体包括以下步骤：

识别文字信息中的名词词汇，并统计各名词词汇的出现次数；

根据各名词词汇的出现次数获取若干个关键名词词汇作为文字特征。

进一步，所述预设的检索模型为网络爬虫模型，所述结合文字特征和预设的检索模型获取图片信息和/或视频信息具体为：