[发明专利]用于语音翻译的方法、装置、电子设备和存储介质有效
| 申请号: | 201810714043.4 | 申请日: | 2018-06-29 |
| 公开(公告)号: | CN108986820B | 公开(公告)日: | 2020-12-18 |
| 发明(设计)人: | 何中军;吴华;王海峰 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
| 主分类号: | G10L15/26 | 分类号: | G10L15/26;G06F40/58 |
| 代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 李辉;张曦 |
| 地址: | 100094 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 用于 语音 翻译 方法 装置 电子设备 存储 介质 | ||
1.一种用于语音翻译的方法,包括:
确定与来自用户的、源语言形式的源语音数据中的命名实体相对应的音素序列,所述音素序列包括源语言形式的至少一个音素;
基于所述音素序列和所述用户的地理位置,确定所述命名实体的目标语言形式的目标文字表示;以及
基于所述目标文字表示,生成与所述源语音数据相对应的、目标语言形式的目标语音数据。
2.根据权利要求1所述的方法,其中确定与命名实体相对应的音素序列包括:
将所述源语音数据识别为源语言形式的源文本;
对所述源文本进行分词以确定所述命名实体的源语言形式的源文字表示;以及
将所述源文字表示转换为源语言形式的音素序列。
3.根据权利要求2所述的方法,其中对所述源文本进行分词包括:
确定与所述地理位置相关联的、源语言形式的命名实体集合;以及
基于所述命名实体集合对所述源文本进行分词。
4.根据权利要求1所述的方法,其中确定所述命名实体的目标语言形式的目标文字表示包括:
以所述音素序列和所述地理位置为索引,在预定词典中查找与所述命名实体相关联的条目,所述条目包括所述音素序列、所述目标文字表示和所述地理位置;以及
从所述条目获得所述目标文字表示。
5.根据权利要求4所述的方法,其中所述条目还包括以下至少一项:
所述命名实体的源语言形式的源文字表示、以及所述命名实体的类型。
6.根据权利要求1所述的方法,其中生成目标语言形式的目标语音数据包括:
将所述源语音数据识别为源语言形式的源文本;
将所述源文本翻译为目标语言形式的目标文本;
利用所述目标文字表示来调整所述目标文本;以及
将经调整的所述目标文本转换为所述目标语音数据。
7.一种用于语音翻译的装置,包括:
第一确定模块,被配置为确定与来自用户的、源语言形式的源语音数据中的命名实体相对应的音素序列,所述音素序列包括源语言形式的至少一个音素;
第二确定模块,被配置为基于所述音素序列和所述用户的地理位置,确定所述命名实体的目标语言形式的目标文字表示;以及
生成模块,被配置为基于所述目标文字表示,生成与所述源语音数据相对应的、目标语言形式的目标语音数据。
8.根据权利要求7所述的装置,其中所述第一确定模块还包括:
第一识别模块,被配置为将所述源语音数据识别为源语言形式的源文本;
分词模块,被配置为对所述源文本进行分词以确定所述命名实体的源语言形式的源文字表示;以及
第一转换模块,被配置为将所述源文字表示转换为源语言形式的音素序列。
9.根据权利要求8所述的装置,其中所述分词模块还包括:
第三确定模块,被配置为确定与所述地理位置相关联的、源语言形式的命名实体集合;并且
所述分词模块还被配置为基于所述命名实体集合对所述源文本进行分词。
10.根据权利要求7所述的装置,其中所述第二确定模块还包括:
查找模块,被配置为以所述音素序列和所述地理位置为索引,在预定词典中查找与所述命名实体相关联的条目,所述条目包括所述音素序列、所述目标文字表示和所述地理位置;以及
获得模块,被配置为从所述条目获得所述目标文字表示。
11.根据权利要求10所述的装置,其中所述条目还包括以下至少一项:
所述命名实体的源语言形式的源文字表示、以及所述命名实体的类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810714043.4/1.html,转载请声明来源钻瓜专利网。





