[发明专利]实时语音翻译方法、装置、设备及存储介质有效
| 申请号: | 202210164989.4 | 申请日: | 2022-02-23 |
| 公开(公告)号: | CN114239613B | 公开(公告)日: | 2022-08-02 |
| 发明(设计)人: | 葛正晗;罗维;黄忠强 | 申请(专利权)人: | 阿里巴巴达摩院(杭州)科技有限公司 |
| 主分类号: | G06F40/58 | 分类号: | G06F40/58;G10L15/26 |
| 代理公司: | 北京开阳星知识产权代理有限公司 11710 | 代理人: | 张子青 |
| 地址: | 310023 浙江省杭州市余杭*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 实时 语音 翻译 方法 装置 设备 存储 介质 | ||
本公开涉及一种实时语音翻译方法、装置、设备及存储介质。本公开通过获取历史时刻的目标语种文本中的第一前缀部分,对当前时刻已获取到的原语种语音进行语音识别,得到当前时刻的原语种文本。进一步,根据所述第一前缀部分,将所述当前时刻的原语种文本翻译为所述当前时刻的目标语种文本,所述第一前缀部分在所述当前时刻的目标语种文本中保持不变。也就是说,根据当前时刻的原语种文本和历史时刻译文的一定长度的前缀,输出当前时刻的原语种文本所对应的译文,可以保证当前时刻的译文的一定长度的前缀与历史时刻译文的一定长度的前缀保持一致,从而可以有效缓解实时语音翻译中已输出的译文不稳定的问题。
技术领域
本公开涉及信息技术领域,尤其涉及一种实时语音翻译方法、装置、设备及存储介质。
背景技术
在实时语音翻译中,需要将原语种语音实时的识别为原语种文本,然后将该原语种文本实时的翻译为目标语种文本。
但是,本申请的发明人发现,随着时间的不断推移,原语种语音所播报的内容不断增加,识别得到的原语种文本的内容不断增加,导致不同时刻翻译得到的目标语种文本的变化较大,从而影响用户体验。
发明内容
为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种实时语音翻译方法、装置、设备及存储介质,以保证当前时刻的译文的一定长度的前缀与历史时刻译文的一定长度的前缀保持一致,从而可以有效缓解实时语音翻译中已输出的译文不稳定的问题。
第一方面,本公开实施例提供一种实时语音翻译方法,所述方法包括:
获取实时语音;
对所述实时语音进行实时语音识别,得到实时的原语种文本;
根据历史时刻翻译得到的目标语种文本中的第一前缀部分,将所述实时的原语种文本翻译为实时的目标语种文本,所述第一前缀部分在所述实时的目标语种文本中保持不变。
第二方面,本公开实施例提供一种实时字幕生成方法,所述方法包括:
获取实时语音;
对所述实时语音进行实时语音识别,得到实时的原语种文本;
根据历史时刻翻译得到的目标语种文本中的第一前缀部分,将所述实时的原语种文本翻译为实时的目标语种文本,所述第一前缀部分在所述实时的目标语种文本中保持不变;
根据所述实时的原语种文本和所述实时的目标语种文本,生成实时字幕,所述实时字幕包括所述实时的原语种文本和所述实时的目标语种文本中的至少一个。
第三方面,本公开实施例提供一种实时翻译方法,包括:
获取历史时刻的目标语种文本中的第一前缀部分;
对当前时刻已获取到的原语种语音进行语音识别,得到当前时刻的原语种文本;
根据所述第一前缀部分,将所述当前时刻的原语种文本翻译为所述当前时刻的目标语种文本,所述第一前缀部分在所述当前时刻的目标语种文本中保持不变。
第四方面,本公开实施例提供一种实时翻译装置,包括:
获取模块,用于获取历史时刻的目标语种文本中的第一前缀部分;
语音识别模块,用于对当前时刻已获取到的原语种语音进行语音识别,得到当前时刻的原语种文本;
翻译模块,用于根据所述第一前缀部分,将所述当前时刻的原语种文本翻译为所述当前时刻的目标语种文本,所述第一前缀部分在所述当前时刻的目标语种文本中保持不变。
第五方面,本公开实施例提供一种电子设备,包括:
存储器;
处理器;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴达摩院(杭州)科技有限公司,未经阿里巴巴达摩院(杭州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210164989.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:钢水罐倒砖倾翻装置
- 下一篇:一种微生物菌剂生产设备





