[发明专利]一种语音和视频字幕同步呈现的方法及系统有效
申请号: | 200910037300.6 | 申请日: | 2009-02-20 |
公开(公告)号: | CN101505397A | 公开(公告)日: | 2009-08-12 |
发明(设计)人: | 杨海曜 | 申请(专利权)人: | 深圳华为通信技术有限公司 |
主分类号: | H04N7/15 | 分类号: | H04N7/15;H04N5/262 |
代理公司: | 广州三环专利代理有限公司 | 代理人: | 郝传鑫;熊贤卿 |
地址: | 518129广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 视频 字幕 同步 呈现 方法 系统 | ||
1.一种语音和视频字幕同步呈现的方法,其特征在于,包括以下步骤:
接收到语音信息;
通过解析所述接收到的语音信息,识别出该语音信息对应的文字内容信息;
根据全局指针、逐句指针以及逐字指针查找预置文字内容信息,并逐字逐 句地将所述识别出的文字内容信息与所述查找到的预置文字内容信息进行对 比,得出所述识别出的文字内容信息与所述预置文字内容信息的相似度;
判断所述相似度是否达到预设的文字相关度,当判断为是时,则判定所述 识别出的语音信息对应的文字内容信息与所述预置的文字内容信息匹配;
其中,所述全局指针用于定位到预置文字内容信息中的某个段落位置;
所述逐句指针用于定位到所述某个段落的某个句子上;
所述逐字指针用于定位到所述某个句子中的某个字或词;
视频同步显示所述语音信息对应的预置文字内容。
2.如权利要求1所述的方法,其特征在于,所述判断所述识别出的文字内 容信息与预置文字内容信息是否匹配之前还包括:
接收并保存预置文字内容信息。
3.如权利要求1所述的方法,其特征在于,所述视频同步显示所述语音信 息对应的预置文字内容包括:
当判定所述识别出的语音信息对应的文字内容信息与所述预置的文字内容 信息匹配时,启动字幕超前显示模式对所述预置文字内容信息进行显示,即在 一句语音信息未接收完成前,提前显示与所述一句语音信息相匹配的预置文字 内容信息;
或,当判定所述识别出的语音信息对应的文字内容信息与所述预置的文字 内容信息匹配时,启动全句语音识别显示模式对所述预置文字内容信息进行显 示,即在一句语音信息接收并识别完成后,才显示与所述一句语音相匹配的预 置文字内容信息。
4.如权利要求1所述的方法,其特征在于,所述预设的文字相关度包括字 相关度、句子相关度以及段落相关度中一种或多种。
5.如权利要求1所述的方法,其特征在于,当判断所述相似度是否达到预 设的文字相关度的判断结果为否时,输出异常。
6.一种语音和视频字幕同步呈现的系统,其特征在于,包括:
语义识别模块,用于接收语音信息,并通过解析所述接收到的语音信息, 识别出该语音信息对应的文字内容信息;
查找单元,用于根据全局指针、逐句指针以及逐字指针查找预置文字内容 信息,其中,所述全局指针用于定位到预置文字内容信息中的某个段落位置; 所述逐句指针用于定位到所述某个段落的某个句子上;所述逐字指针用于定位 到所述某个句子中的某个字或词;
判断单元,用于逐字逐句地将所述识别出的文字内容信息与所述查找到的 预置文字内容信息进行对比,得出所述识别出的文字内容信息与所述预置文字 内容信息的相似度;判断所述相似度是否达到预设的文字相关度,当判断为是 时,则判定所述识别出的语音信息对应的文字内容信息与所述预置的文字内容 信息匹配;
显示模块,用于当所述判断单元判断为是时,在显示视频时,同步显示所 述预置文字内容。
7.如权利要求6所述的语言和视频字幕同步呈现的系统,其特征在于,还 包括:
预置模块,用于接收并保存预置文字内容信息。
8.如权利要求6所述的语言和视频字幕同步呈现的系统,其特征在于,所 述显示模块进一步包括:显示控制单元,用于控制所述预置文字内容信息的显 示输出模式,所述显示输出模式包括字幕超前显示模式或全句语音识别显示模 式;
显示输出单元,用于根据所述显示控制单元的控制,按照字幕超前显示模 式显示所述预置文字内容信息或按照全句语音识别显示模式显示所述预置文字 内容信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华为通信技术有限公司,未经深圳华为通信技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910037300.6/1.html,转载请声明来源钻瓜专利网。