[发明专利]视频字幕的处理方法、装置、设备和存储介质有效

专利信息
申请号: 202110168920.4 申请日: 2021-02-07
公开(公告)号: CN112995749B 公开(公告)日: 2023-05-26
发明(设计)人: 苏再卿;焦少慧;张清源;赵世杰;詹亘 申请(专利权)人: 北京字节跳动网络技术有限公司
主分类号: H04N21/435 分类号: H04N21/435;H04N21/439;H04N21/44;H04N21/4402;H04N21/485;H04N21/488;H04N21/8547;G10L15/22;G10L15/26;G06V20/62;G06T5/00;G06T7/13
代理公司: 北京远智汇知识产权代理有限公司 11659 代理人: 范坤坤
地址: 100041 北京市石景山区*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 视频 字幕 处理 方法 装置 设备 存储 介质
【说明书】:

发明公开了一种视频字幕的处理方法、装置、设备和存储介质。该方法包括:确定原始视频中各视频帧的字幕区域,并识别所述字幕区域内的字幕信息,得到第一候选字幕;对所述原始视频的音频信息进行语音识别,得到第二候选字幕;根据所述第一候选字幕和所述第二候选字幕,生成目标字幕;将所述目标字幕和所述原始视频的视频数据结合,生成包含所述目标字幕的目标视频。在对原始视频的字幕进行处理的过程中,不仅结合了原始视频中字幕区域内的原始字幕信息,还结合了原始视频中的音频信息,即利用多种不同模态的信息来生成目标字幕,使得经过字幕处理后的目标视频的字幕与实际更相符,从而提高了字幕信息的准确性。

技术领域

本发明实施例涉及视频处理技术领域,尤其涉及一种视频字幕的处理方法、装置、设备和存储介质。

背景技术

随着互联网技术的不断发展,对于视频的二次创作的需求越来越广泛。例如,老电影的字幕泛白,导致用户无法看清字幕,此时需要对老电影的字幕进行二次处理。因此,为了满足用户的需求,对于视频字幕进行处理是很有必要的。但是,目前一些常规视频字幕的处理方法较为粗犷,往往导致最终得到的字幕与实际不符,准确性较低。

发明内容

针对传统技术导致最终得到的字幕与实际不符,准确性较低的技术问题,本发明提供一种视频字幕的处理方法、装置、设备和存储介质。

第一方面,本发明实施例提供一种视频字幕的处理方法,包括:

确定原始视频中各视频帧的字幕区域,并识别所述字幕区域内的字幕信息,得到第一候选字幕;

对所述原始视频的音频信息进行语音识别,得到第二候选字幕;

根据所述第一候选字幕和所述第二候选字幕,生成目标字幕;

将所述目标字幕和所述原始视频的视频数据结合,生成包含所述目标字幕的目标视频。

第二方面,本发明实施例提供一种视频字幕的处理装置,包括:

第一识别模块,用于确定原始视频中各视频帧的字幕区域,并识别所述字幕区域内的字幕信息,得到第一候选字幕;

第二识别模块,用于对所述原始视频的音频信息进行语音识别,得到第二候选字幕;

字幕生成模块,用于根据所述第一候选字幕和所述第二候选字幕,生成目标字幕;

视频生成模块,用于将所述目标字幕和所述原始视频的视频数据结合,生成包含所述目标字幕的目标视频。

第三方面,本发明实施例提供一种视频字幕的处理设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现本发明实施例第一方面提供的视频字幕的处理方法的步骤。

第四方面,本发明实施例提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本发明实施例第一方面提供的视频字幕的处理方法的步骤。

本发明实施例提供的视频字幕的处理方法、装置、设备和存储介质,在确定原始视频中各视频帧的字幕区域之后,识别各字幕区域内的字幕信息,得到第一候选字幕,并对原始视频的音频信息进行语音识别,得到第二候选字幕,接着,根据第一候选字幕和第二候选字幕生成目标字幕,再将目标字幕和原始视频的视频数据结合,生成包含该目标字幕的目标视频。在对原始视频的字幕进行处理的过程中,不仅结合了原始视频中字幕区域内的原始字幕信息,还结合了原始视频中的音频信息,即利用多种不同模态的信息来生成目标字幕,使得经过字幕处理后的目标视频的字幕与实际更相符,从而提高了字幕信息的准确性。

附图说明

结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京字节跳动网络技术有限公司,未经北京字节跳动网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110168920.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top