[发明专利]同声传译方法、装置、电子设备及存储介质在审
申请号: | 201911268006.6 | 申请日: | 2019-12-11 |
公开(公告)号: | CN111161710A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 杨林举 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
主分类号: | G10L15/04 | 分类号: | G10L15/04;G10L15/26;G10L15/30;G10L13/08 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 姚文娴;张颖玲 |
地址: | 523860 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 同声 传译 方法 装置 电子设备 存储 介质 | ||
本发明实施例公开了一种同声传译方法、装置、电子设备及存储介质。其中,方法包括:获得语音数据,对所述语音数据进行文本识别,得到识别文本;对所述语音数据进行切分,得到至少一个语音片段;确定所述至少一个语音片段中各语音片段对应的目标人物;确定所述目标人物对应的第一呈现格式,以在呈现所述识别文本时以所述第一呈现格式呈现所述目标人物对应的目标文本片段;所述目标文本片段基于所述目标人物对应的语音片段得到;所述第一呈现格式与第二呈现格式不同;所述第二呈现格式为其他人物对应的识别文本中的文本片段的呈现格式;所述识别文本用于在所述语音数据被播放时进行呈现。
技术领域
本发明涉及同声传译领域,尤其涉及一种同声传译方法、装置、电子设备及存储介质。
背景技术
随着人工智能(AI,Artificial Intelligence)技术不断发展与成熟,运用人工智能技术解决生活中常见问题的产品不断涌现。其中,机器同声传译(又称为机器同传、AI同声传译、AI同传),结合了语音识别(ASR,Automatic Speech Recognition)、机器翻译(MT,Machine Translation)等技术,被广泛应用于会议、访谈节目等场景,替代或部分替代了人工,实现同声传译(SI,Simultaneous Interpretation)。
相关机器同传系统中,通过语言识别技术自动识别语音,运用机器翻译技术将识别得到的源语言文字翻译成目标语言文字,通过屏幕直接展示翻译后的结果。然而,仅将演讲者的说话内容进行显示,用户在观看时无法确定演讲者,难以结合演讲者的相关身份信息理解演讲内容。
发明内容
为解决相关存在的技术问题,本发明实施例提供一种同声传译方法、装置、电子设备及存储介质。
本发明实施例的技术方案是这样实现的:
本发明实施例提供一种同声传译方法,包括:
获得语音数据,对所述语音数据进行文本识别,得到识别文本;
对所述语音数据进行切分,得到至少一个语音片段;确定所述至少一个语音片段中各语音片段对应的目标人物;
确定所述目标人物对应的第一呈现格式,以在呈现所述识别文本时以所述第一呈现格式呈现所述目标人物对应的目标文本片段;所述目标文本片段基于所述目标人物对应的语音片段得到;所述第一呈现格式与第二呈现格式不同;所述第二呈现格式为其他人物对应的识别文本中的文本片段的呈现格式;所述识别文本用于在所述语音数据被播放时进行呈现。
上述方案中,所述对所述语音数据进行切分,得到所述语音数据中的至少一个语音片段,包括:
对所述语音数据进行端点检测,根据检测得到的端点切分所述语音数据,得到至少一个语音片段。
上述方案中,所述对所述语音数据进行切分,得到所述语音数据中的至少一个语音片段,包括:
对所述语音数据进行语义分析,根据语义分析结果对所述语音数据进行切分,得到至少一个语音片段。
上述方案中,所述确定所述至少一个语音片段中各语音片段对应的目标人物,包括:
确定所述语音片段对应的目标声纹特征;
根据所述目标声纹特征查询声纹数据库,确定所述语音数据对应的目标人物;所述声纹数据库包括至少一个声纹特征和所述至少一个声纹特征中各声纹特征对应的人物。
上述方案中,所述确定所述至少一个语音片段中各语音片段对应的目标人物,包括:
确定所述语音片段对应的目标采集声道;
基于声道和人物的对应关系,确定所述目标采集声道对应的目标人物。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911268006.6/2.html,转载请声明来源钻瓜专利网。