[发明专利]一种基于视频的多语种字幕生成方法及装置在审
申请号: | 202110429463.X | 申请日: | 2021-04-21 |
公开(公告)号: | CN113099292A | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 肖中渠;周红丽;李东 | 申请(专利权)人: | 湖南快乐阳光互动娱乐传媒有限公司 |
主分类号: | H04N21/435 | 分类号: | H04N21/435;H04N21/439;H04N21/4402;H04N21/472;H04N21/488;G06F40/30;G06F40/47 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 周初冬 |
地址: | 410003 湖南省*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 视频 语种 字幕 生成 方法 装置 | ||
本申请公开了一种基于视频的多语种字幕生成方法及装置,对待处理视频文件进行转码,得到音频文件。对音频文件进行解析,得到第一对应关系,第一对应关系包括话语与时间戳的对应关系。对话语进行语义识别,得到第二对应关系,第二对应关系包括话语和文本信息的对应关系。基于第一对应关系和第二对应关系,生成字幕文件。对字幕文件进行翻译,得到与预设语种对应的字幕文件,对外发布与预设语种对应的字幕文件。相较于现有技术,本申请所述方案无需用户使用任何专业软件进行字幕制作,便能够按照用户需求,生成与预设语种对应的字幕文件,有效减少多语种字幕制作过程所耗费的时间,显著提高多语种字幕制作过程的效率。
技术领域
本申请涉及多媒体技术领域,尤其涉及一种基于视频的多语种字幕生成方法及装置。
背景技术
在视频网站中,国际化是重要的一个业务版图。随着视频网站国际化的推进,字幕需要支持多语种,以满足不同地区用户的需求。用户可以选择切换不同的字幕。在现实情况下,视频网站支持多语种字幕,满足不同地区用户需求,增加平台粘性。但在技术实现上,通常需要专业人员制作字幕文件,然后上传一种或多种语言字幕到视频网站中,以便用户随时观看,此过程耗时较长,对人员专业素质要求高,且工作繁琐、量大,很难在短时间内将字幕文件推送给视频的阅览者。
在目前主流视频网站中,主要通过人人译视界等字幕工具制作字幕,然而,针对多语种字幕的制作过程,现有技术所示的字幕制作过程效率较低,难以满足视频上线的时效性。
发明内容
本申请提供了一种基于视频的多语种字幕生成方法及装置,目的在于提高多语种字幕制作过程的效率。
为了实现上述目的,本申请提供了以下技术方案:
一种基于视频的多语种字幕生成方法,包括:
对待处理视频文件进行转码,得到音频文件;
对所述音频文件进行解析,得到第一对应关系;所述第一对应关系包括话语与时间戳的对应关系;
对所述话语进行语义识别,得到第二对应关系;所述第二对应关系包括所述话语和文本信息的对应关系;
基于所述第一对应关系和所述第二对应关系,生成字幕文件;
对所述字幕文件进行翻译,得到与预设语种对应的字幕文件;
对外发布所述与预设语种对应的字幕文件。
可选的,所述基于所述第一对应关系和所述第二对应关系,生成字幕文件之后,还包括:
将所述字幕文件加载至所述待处理视频文件中,得到第一视频文件,并向所述用户展示所述第一视频文件。
可选的,还包括:
在接收到所述用户基于所述第一视频文件发送的第二操作指令的情况下,对所述字幕文件进行修正;
所述对所述字幕文件进行翻译,得到与预设语种对应的字幕文件,包括:
使用预设的字幕翻译工具,对修正后的所述字幕文件进行翻译,得到与预设语种对应的字幕文件。
可选的,所述对所述字幕文件进行翻译,得到与预设语种对应的字幕文件之后,还包括:
将所述与预设语种对应的字幕文件加载至所述待处理视频文件中,得到第二视频文件,并向所述用户展示所述第二视频文件。
可选的,还包括:
在接收到所述用户基于所述第二视频文件发送的第三操作指令的情况下,对所述与预设语种对应的字幕文件进行修正,得到目标字幕文件;
所述对外发布所述与预设语种对应的字幕文件,包括:
对外发布所述目标字幕文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南快乐阳光互动娱乐传媒有限公司,未经湖南快乐阳光互动娱乐传媒有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110429463.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种液态金属导线的制备方法及液态金属导线
- 下一篇:一种钣金钻孔刀