[发明专利]转换表达方式的方法和装置有效
| 申请号: | 01116236.8 | 申请日: | 2001-03-12 |
| 公开(公告)号: | CN1319836A | 公开(公告)日: | 2001-10-31 |
| 发明(设计)人: | 胁田由实;松井谦二 | 申请(专利权)人: | 松下电器产业株式会社 |
| 主分类号: | G10L15/00 | 分类号: | G10L15/00 |
| 代理公司: | 上海专利商标事务所 | 代理人: | 孙敬国 |
| 地址: | 日本国*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 转换 表达方式 方法 装置 | ||
本发明涉及一种转换输入句子的表达方式并输出经过转换的输入句子的表达方式的表达方式转换方法、表达方式转换装置以及程序,例如,一种执行语言转换比如书面语翻译或口语翻译、将书面语言转换为口语语言的句子模式转换或概述一个复杂或冗长的句子并输出概要的概要生成的表达方式转换方法、表达方式转换装置以及程序。
下文以翻译软件程序作为常规技术的实例。
翻译软件程序包括语音识别装置和语言翻译装置,并通过如下的方式实现翻译:连续地执行语音识别以将以声音信号输入的声音句子转换为以文字串表示的输出句子,并连续地执行作为表达方式转换的语言翻译以将以文字串表示的输入句子翻译成另一种语言的句子。
按如上所描述的方式执行语言翻译的语言翻译装置包括分析输入句子的语法或语义结构的语言分析装置、基于所分析的结果将输入句子转换成另一种语言的语言转换装置以及从所翻译的结果中产生自然语言输出句子的输出句子生成装置。
在口语翻译软件程序以及一些书面翻译软件程序中,为正确地翻译不符合语法的不规则的表达方式(经常应用在口语中),经常应用这样的一种技术:依据语法规则并不能进行语法分析,但是可以学习类似于实际输入的句子的例句,并且可以搜索类似的例句以进行语言分析。参看在附图8中所示的实例来描述这种常规的翻译软件程序的实例。
在此描述将日语声音的句子翻译成英语声音的句子情况实例。要翻译的语言称为原始语言,原始语言所翻译成的语言称为目标语言。
在进行翻译之前,从附图8的双语言资料库1中提取声音语言的规则。在双语言资料库中1中,写有许多双语言声音例句,这些双语言声音句子每个都包括一对彼此对等的日语声音例句和英语声音例句。在附图9-1(a)中所示的在双语言资料库1中所写的双语言声音例句的实例为双语言声音例句70。
在此考虑这样的情况:当发出该句子的声音时遗漏或错误地识别了某些字词,将每个声音例句都分成最小的单元作为语义单元(下文中称为短语),并生成短语规则和短语间的依赖关系规则。
首先,短语确定装置61将双语言声音例句分成短语。在附图9-1(b)中,示出了所获得双语言短语作为双语言短语(A)71和双语言短语(B)72。
然后,双语言短语字典产生部分62以一定格式建立相关的短语字典62,在该字典中将在短语中的内容字转换为变量。
例如,在附图9-1(a)中所示的双语言声音例句70包括声音例句“Heya noyoyakuo onegai shitain desuga(打不出来)”和“I’d like toreserve a room,”将该例句划分为如下的两个双语言短语:(A)“heya no yoyaku()”以及“reserve a room”作为双语言短语(A)71;以及(B)“onegaishitain desuga()”和“I’d like to”作为双语言短语(B)72。
通过应用如在附图9-2(e)中所示前文中所产生的分类词汇表64,内容字比如“heya()”、“yoyaku()”以及“onegai()”都分别以变量X、Y和Z表示。在此所分类的词汇表64是一种列出了内容字的表,变量将内容字作为它们的值。例如,变量X取值比如“heya()”或“kaigishitsu()”或“kumma()”,内容字“heya()”是变量X可以取的值。因此,双语言短语(A)71的内容字“heya()”可以以变量X替换。
在这种方式中,两个双语言短语规则(A)“X no Y()”“YX”以及(B)“Z shitain desuga()”“I’d like to”都写在双语言短语字典62中。
如附图9-2(d)所示,为了将短语的顺序关系作为短语间规则63的规则,短语间关系比如“(A)o(B)((A)在(B))”“(B)(A)”都存储在短语间规则表63中。在双语言资料库1中执行对所有的声音句子的这种处理。
在执行翻译的过程中,首先将原始语言声音输入到语音识别装置64中。语音识别装置64输出在声音上最类似的字串作为语音识别选择,例如从在双语言短语字典62中所书写的字串中输出作为从以短语间规则63书写的短语串中能够推测的短语和字串。
语言翻译装置65接收以这种方式识别的连续字串、将所输入的连续的字串转换成在双语言短语字典62中所书写的短语串并搜索与每个短语串相对应的短语间规则63。然后语言翻译装置65基于与每个短语对等的目标语言短语和目标语言的短语间规则将输入的原始语言识别结果句子转换为目标语言句子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下电器产业株式会社,未经松下电器产业株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/01116236.8/2.html,转载请声明来源钻瓜专利网。





