[发明专利]语音翻译方法和语音翻译装置无效
| 申请号: | 200710193374.X | 申请日: | 2007-12-10 |
| 公开(公告)号: | CN101458681A | 公开(公告)日: | 2009-06-17 |
| 发明(设计)人: | 李剑峰;王海峰;吴华 | 申请(专利权)人: | 株式会社东芝 |
| 主分类号: | G06F17/28 | 分类号: | G06F17/28;G10L15/26 |
| 代理公司: | 北京市中咨律师事务所 | 代理人: | 李 峥;刘瑞东 |
| 地址: | 日本*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 翻译 方法 装置 | ||
1.一种语音翻译方法,包括:
将上述语音识别为文本,所述文本包括至少一个包含多个单句的长句;
将上述至少一个长句切分为多个单句;以及
将上述切分的多个单句中的每一个翻译为目标语种的句子。
2.根据权利要求1所述的语音翻译方法,其中,上述将上述至少一个长句切分为多个单句的步骤包括:
利用切分模型将上述至少一个长句切分为多个单句。
3.根据权利要求2所述的语音翻译方法,其中,上述利用切分模型将上述至少一个长句切分为多个单句的步骤包括:
为上述至少一个长句生成多个候选切分路径;
利用上述切分模型计算上述多个候选切分路径中的每一个的得分;以及
选择得分最高的候选切分路径作为最优的切分路径。
4.根据权利要求2或3所述的语音翻译方法,其中,上述切分模型包括多个n元组(n-gram)及其概率。
5.根据权利要求1-4中任何一项所述的语音翻译方法,还包括:
修正上述将上述至少一个长句切分为多个单句的切分结果。
6.根据权利要求5所述的语音翻译方法,其中,上述修正上述将上述至少一个长句切分为多个单句的切分结果的步骤包括:
删除或增加上述切分结果中的切分位置。
7.根据权利要求5或6所述的语音翻译方法,还包括:
根据上述修正后的切分结果更新上述切分模型。
8.根据权利要求7所述的语音翻译方法,其中,上述根据上述修正后的切分结果更新上述切分模型的步骤包括:
加强上述修正步骤增加的n元组的概率。
9.根据权利要求7所述的语音翻译方法,其中,上述根据上述修正后的切分结果更新上述切分模型的步骤包括:
减弱上述修正步骤删除的n元组的概率。
10.一种语音翻译装置,包括:
语音识别单元,用于将上述语音识别为文本,所述文本包括至少一个包含多个单句的长句;
切分单元,用于将上述至少一个长句切分为多个单句;以及
翻译单元,用于将上述切分单元切分的多个单句中的每一个翻译为目标语种的句子。
11.根据权利要求10所述的语音翻译装置,其中,上述切分单元用于:
利用切分模型将上述至少一个长句切分为多个单句。
12.根据权利要求11所述的语音翻译装置,其中,上述切分单元包括:
候选切分路径生成单元,用于为上述至少一个长句生成多个候选切分路径;
得分计算单元,用于利用上述切分模型计算上述多个候选切分路径中的每一个的得分;以及
最优切分路径选择单元,用于选择得分最高的候选切分路径作为最优的切分路径。
13.根据权利要求11或12所述的语音翻译装置,其中,上述切分模型包括多个n元组(n-gram)及其概率。
14.根据权利要求10-13中任何一项所述的语音翻译装置,还包括:
修正单元,用于修正上述切分单元的切分结果。
15.根据权利要求14所述的语音翻译装置,其中,上述修正单元用于:
删除或增加上述切分结果中的切分位置。
16.根据权利要求14或15所述的语音翻译装置,还包括:
模型更新单元,用于根据上述修正单元修正后的切分结果更新上述切分模型。
17.根据权利要求16所述的语音翻译装置,其中,上述模型更新单元用于:
加强上述修正单元增加的n元组的概率。
18.根据权利要求16所述的语音翻译装置,其中,上述模型更新单元用于:
减弱上述修正单元删除的n元组的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710193374.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:复杂试验数据追溯方法
- 下一篇:一种使不同浏览器间互相调用网页的方法





