[发明专利]一种视频字幕添加方法及系统在审
申请号: | 202110310014.3 | 申请日: | 2021-03-23 |
公开(公告)号: | CN113194356A | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 武永鑫 | 申请(专利权)人: | 武永鑫 |
主分类号: | H04N21/439 | 分类号: | H04N21/439;H04N21/44;H04N21/488;G10L15/26 |
代理公司: | 北京知呱呱知识产权代理有限公司 11577 | 代理人: | 杜立军 |
地址: | 276400 山东省临沂市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 视频 字幕 添加 方法 系统 | ||
一种视频字幕添加方法及系统,通过获取待进行字幕添加的视频对象,判断视频对象的状态属性;获取视频对象包含的音频文件,导入ffmpy3库,获取视频对象及音频文件的存放目录;利用OS模块处理,将视频对象转化为音频文件;采用FFmpeg算法对转换后的音频文件赋予音频属性;采用语音Url形式调用接口,调用API接口对音频文件进行转写;转写完成后,获取转写结果并输出转写后的文本文件;将文本文件与视频对象结合进行视频字幕添加;导出添加视频字幕后的视频对象。本发明实现人工智能化为电影添加字幕,通过自动添加字幕,提高观影效果的同时,方便人们对外文视频的观看;可以极大地减少人工翻译带来的人力与物力,减少翻译成本。
技术领域
本发明涉及视频处理技术领域,具体涉及一种视频字幕添加方法及系统。
背景技术
随着计算机网络发展,视频变得越来越普遍,不管是线上或线下看电影,还是通过视频进行沟通交流,视频已经在人们的生活中发挥越来越重要的作用。视频还是当今社会国与国之间交流的一种途径,由于语言种类的多样性以及大部分人做不到精通多门语言,这就阻碍了人们进一步了解外文。
现阶段,人们大多数情况下是利用特定的观影软件观看,其中的电影都是人工翻译并添加字幕,完全是外文字幕或者没有字幕的外文电影,成为了人们观影的阻碍。另外,当人们浏览外文网址,或者下载无字幕的电影时,都会被一种问题所困扰,也就是“听不懂”,但是通过字幕我们便可以在“听不懂”的情况下“看得懂”。然而目前字幕的添加都需要人工翻译,翻译人员必须精通所要翻译的语言以及翻译后的语言,也就是必须要精通至少两门语言,才可以实现字幕的添加,并且人工翻译的成本较高,比较耗费时间精力。综上,亟需一种视频字幕添加的技术方案。
发明内容
为此,本发明提供一种视频字幕添加方法及系统,实现视频自动添加字幕和无字幕翻译,解决对于无字幕视频只能通过人工翻译并添加字幕耗时成本高问题。
为了实现上述目的,本发明提供如下技术方案:第一方面,提供一种视频字幕添加方法,包括以下步骤:
获取待进行字幕添加的视频对象,判断所述视频对象的状态属性;
获取所述视频对象包含的音频文件:读取所述视频对象及音频文件的存放目录,判断是否存在音频目录,a)当存在音频目录时,将所述音频文件存放到对应的音频目录中;b)当不存在音频目录时,创建音频目录,再将所述音频文件存放到创建的音频目录中;导入ffmpy3库,获取所述视频对象及音频文件的存放目录;利用OS模块处理,将所述视频对象转化为音频文件;采用FFmpeg算法对转换后的所述音频文件赋予音频属性;
采用语音Url形式调用接口,调用API接口对所述音频文件进行转写;
转写完成后,获取转写结果并输出转写后的文本文件;
将所述文本文件与所述视频对象结合进行视频字幕添加;
导出添加视频字幕后的视频对象。
作为视频字幕添加方法的优选方案,所述视频对象的状态属性包括本地属性和在线属性,所述本地属性指所述视频对象来源于本地视频文件,所述在线属性指所述视频对象来源于外文网站。
作为视频字幕添加方法的优选方案,利用OS模块处理,将所述视频对象转化为WAV格式的音频文件。
作为视频字幕添加方法的优选方案,所述音频文件进行转写的步骤包括:
(a1)预处理
调用预处理接口,上传待转写的音频文件的基本信息、分片信息和可配置参数;
(a2)文件分片上传
预处理成功,调用文件上传接口,根据所述分片信息依次上传音频切片;
(a3)合并文件
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武永鑫,未经武永鑫许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110310014.3/2.html,转载请声明来源钻瓜专利网。