[发明专利]一种语音和视频字幕同步呈现的方法及系统有效

专利信息
申请号: 200910037300.6 申请日: 2009-02-20
公开(公告)号: CN101505397A 公开(公告)日: 2009-08-12
发明(设计)人: 杨海曜 申请(专利权)人: 深圳华为通信技术有限公司
主分类号: H04N7/15 分类号: H04N7/15;H04N5/262
代理公司: 广州三环专利代理有限公司 代理人: 郝传鑫;熊贤卿
地址: 518129广东省深*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 语音 视频 字幕 同步 呈现 方法 系统
【说明书】:

技术领域

发明涉及通信领域,尤其涉及一种语音和视频字幕同步呈现的方法和系 统。

背景技术

一般在会议电视和视频演讲中,大多数情况下演讲者一般是采用有稿件的 宣读讲演,根据国际会议的调查发现,一般对着讲稿进行宣读的会议议题,约 占大中型会议的演讲者发言70%时间以上,这70%中同时有配合胶片,而同时 又按照讲演稿进行宣读的,又占有40%,不配有演讲胶片,而直接口头按照讲 稿宣读的,约有30%左右,也就是说即使是即兴演讲发挥也不到30%,稿件一 般不提前发给参与者,而采用朗读方式,一般没有字幕,这样就不便于理解。 另有一种情况是进行演讲录像,然后重新配音或配上字幕,便于听众理解。进 行录像后配字幕或配音的方式中,常见的有同声字幕显示,所述同声字幕显示 一般采用人工识别演讲者的语义,而且是离线手工操作键入字幕,这种方式常 用于录播中。另外就是同声传译,一般演讲者采用不同于听众的语音,在另外 的声音信道上落后一段时间后进行人工翻译,一般字幕或翻译的语音在时间落 后于演讲者语义1至2分钟。

采用同声字幕显示,录像后才能配上字幕,完全非实时的,不能用于现场 的会议电视和视频演讲中。而同声传译,实时性也较差。

发明内容

有鉴于此,本发明实施例提供一种语音和视频字幕同步呈现的方法和系统, 实现了视屏字幕的实时性,且不易出错,演讲者和参与者能够很好的互动。

本发明实施例提供了一种语音和视频字幕同步呈现的方法,包括以下步骤:

接收到语音信息;

通过解析所述接收到的语音信息,识别出该语音信息对应的文字内容信息;

根据全局指针、逐句指针以及逐字指针查找预置文字内容信息,并逐字逐 句地将所述识别出的文字内容信息与所述查找到的预置文字内容信息进行对 比,得出所述识别出的文字内容信息与所述预置文字内容信息的相似度;

判断所述相似度是否达到预设的文字相关度,当判断为是时,则判定所述 识别出的语音信息对应的文字内容信息与所述预置的文字内容信息匹配;

其中,所述全局指针用于定位到预置文字内容信息中的某个段落位置;

所述逐句指针用于定位到所述某个段落的某个句子上;

所述逐字指针用于定位到所述某个句子中的某个字或词;

视频同步显示所述语音信息对应的预置文字内容。

本发明同时还提供了一种语音和视频字幕同步呈现的系统,包括:

语义识别模块,用于接收语音信息,并通过解析所述接收到的语音信息, 识别出该语音信息对应的文字内容信息;

查找单元,用于根据全局指针、逐句指针以及逐逐字指针查找预置文字内 容信息,其中,所述全局指针用于定位到预置文字内容信息中的某个段落位置; 所述逐句指针用于定位到所述某个段落的某个句子上;所述逐逐字指针用于定 位到所述某个句子中的某个字或词;

判断单元,用于逐字逐句地将所述识别出的文字内容信息与所述查找到的 预置文字内容信息进行对比,得出所述识别出的文字内容信息与所述预置文字 内容信息的相似度;判断所述相似度是否达到预设的文字相关度,当判断为是 时,则判定所述识别出的语音信息对应的文字内容信息与所述预置的文字内容 信息匹配;

显示模块,用于当所述判断单元判断为是时,在显示视频时,同步显示所 述预置文字内容。

实施本发明实施例,接收到语音信息,通过解析所述接收到的语音信息识 别出该语音信息对应的文字内容信息,判断所述识别出的该语音信息对应的文 字内容信息与预置文字内容信息是否相同,当判断为是时,视频同步显示所述 语音信息对应的预置文字内容,实现了视屏字幕同步显示的实时性,且不易出 错,使演讲者和参与者能够很好的互动。

附图说明

图1是本发明实施例语音和视频字幕同步呈现的系统的示意图;

图2是本发明实施例语音和视频字幕同步呈现的系统语义识别模块的结构 示意图;

图3是本发明实施例语音和视频字幕同步呈现的系统处理模块的结构示意 图;

图4是本发明实施例语音和视频字幕同步呈现的系统处理模块的判断单元 的结构示意图;

图5是图4中的显示模块的结构示意图;

图6是本发明实施例语音和视频字幕同步呈现的方法的流程图。

具体实施方式

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华为通信技术有限公司,未经深圳华为通信技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910037300.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top