[发明专利]语音翻译方法和语音翻译装置无效
| 申请号: | 200710193374.X | 申请日: | 2007-12-10 |
| 公开(公告)号: | CN101458681A | 公开(公告)日: | 2009-06-17 |
| 发明(设计)人: | 李剑峰;王海峰;吴华 | 申请(专利权)人: | 株式会社东芝 |
| 主分类号: | G06F17/28 | 分类号: | G06F17/28;G10L15/26 |
| 代理公司: | 北京市中咨律师事务所 | 代理人: | 李 峥;刘瑞东 |
| 地址: | 日本*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 翻译 方法 装置 | ||
技术领域
[0001]本发明涉及信息处理技术,具体地涉及语音翻译技术。
背景技术
[0002]通常,对语音进行翻译时,首先需要使用语音识别技术将语音识别成文本,然后利用机器翻译技术进行翻译。
[0003]语音识别技术的具体细节参见L.Rabiner和Biing-HwangJuang的文献“Fundamentals of Speech Recognition”,Prentice Hall,1993(以下称为参考文献1),在此通过参考引入其整个内容。
[0004]机器翻译技术主要分为三类:基于规则的翻译、基于实例的翻译、和基于统计的翻译。这些翻译方法已经较为成功的应用到书面语的翻译中。
[0005]机器翻译技术的具体细节参见Hutchins,John的文献“Retrospect and prospect in computer-based translation”,1999,In Proc.ofMachine Translation Summit VII,pages 30-34(以下称为参考文献2),在此通过参考引入其整个内容。
[0006]自然语流不如书面语流畅,往往会出现停顿、重复、修正等语音现象,这使得语音识别模块不能有效地识别出一个个完整的单句,从而将用户的若干个单句或句子片段组合成一个较长的句子输出给机器翻译模块。由于其输出的长句包含若干个单句,这就给翻译模块带来很大的困难。
[0007]因此,需要一种将语音识别模块识别出的长句切分为若干个单句的方法。
[0008]此外,现有技术也有对长句进行自动切分的方法,但是现有技术的自动切分模块是事先训练好的,在线使用过程中不能根据用户的实际需求自动更新,因此出现切分错误的现象很严重。
[0009]因此,还需要一种有效地减少切分错误、适应用户需求的切分方法。
发明内容
[0010]为了解决上述现有技术中存在的问题,本发明提供了语音翻译方法和语音翻译装置。
[0011]根据本发明的一个方面,提供了一种语音翻译方法,包括:将上述语音识别为文本,所述文本包括至少一个包含多个单句的长句;将上述至少一个长句切分为多个单句;以及将上述多个单句中的每一个翻译为目标语种的句子。
[0012]根据本发明的另一个方面,提供了一种语音翻译装置,包括:语音识别单元,用于将上述语音识别为文本,所述文本包括至少一个包含多个单句的长句;切分单元,用于将上述至少一个长句切分为多个单句;以及翻译单元,用于将上述多个单句中的每一个翻译为目标语种的句子。
附图说明
[0013]相信通过以下结合附图对本发明具体实施方式的说明,能够使人们更好地了解本发明上述的特点、优点和目的。
[0014]图1是根据本发明的一个实施例的语音翻译方法的流程图;
[0015]图2是根据本发明的一个实施例的语音翻译方法的详细流程图;
[0016]图3是示出训练切分模型的过程的详细示意图;
[0017]图4是示出搜索最优切分路径的过程的详细示意图;
[0018]图5是示出修正过程和更新切分模型的过程的详细示意图;以及
[0019]图6是根据本发明的另一个实施例的语音翻译装置的方框图。
具体实施方式
[0020]下面就结合附图对本发明的各个优选实施例进行详细的说明。
[0021]语音翻译方法
[0022]图1是根据本发明的一个实施例的语音翻译方法的流程图。下面就结合该图,对本实施例进行描述。
[0023]如图1所示,首先,在步骤101,将用户说出的语音识别为文本。在本实施例中,可以使用本领域的技术人员公知的或未来开发的任何语音识别技术,例如上述参考文献1中所公开的语音识别技术,本发明对此没有任何限制,只要能够将输入的语音识别为文本即可。
[0024]在本实施例中,在步骤101中识别出的文本包括一个和多个包含多个单句的长句。这些长句是由若干个简单、完整的单句构成,例如下面的句子:
That′s very kind of you but I don′t think I will I′m driving.
其由下面的3个单句构成:
That′s very kind of you.
But I don′t think I will.
I′m driving.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710193374.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:复杂试验数据追溯方法
- 下一篇:一种使不同浏览器间互相调用网页的方法





