[发明专利]一种云翻译输入法及系统在审
申请号: | 201510288779.6 | 申请日: | 2015-05-29 |
公开(公告)号: | CN104834633A | 公开(公告)日: | 2015-08-12 |
发明(设计)人: | 史晓东;陈毅东;王博立 | 申请(专利权)人: | 厦门大学 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森 |
地址: | 361005 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 翻译 输入法 系统 | ||
技术领域
本发明涉及云计算、机器翻译、计算机辅助翻译、概率词典和输入法等领域,尤其是涉及一种云翻译输入法及系统。
背景技术
目前,涉及翻译输入法的中国专利申请有:公开(公告)号为CN102662490A,申请人为北京语智云帆科技有限公司的“一种具有辅助翻译功能的输入方法”;公开(公告)号为CN101034407,申请人为传神联合(北京)信息技术有限公司的“一种翻译过程中基于场景词库的快速输入法”。这类输入法利用用户当前正在翻译的原文信息,对候选词表进行扩充和调序,从而提高用户译文输入的效率,可简称为“翻译输入法”。
以上的翻译输入法都是采用基于词典的方法,通过选取原文中出现的词语并在机读词典中查询对应的翻译,将这些翻译加入候选词表并对其进行调序。这种基于词典的方法仅考虑了词语级别的翻译,未考虑词语所在上下文对词义的影响,难以解决自然语言中大量存在的歧义现象。此外,现有的翻译辅助输入法都是采用本地输入法的方式实现,未引入云服务架构,导致不能采用更大规模的多语言的语料、词典、术语表等数据资源,不能引入支持强制解码的机器翻译等对计算机运算能力要求较高的先进解码技术,也不能实现跨平台特性。
发明内容
本发明的目的在于解决现有技术中存在的上述问题,提供基于机器翻译引擎并适用于任何语言、任何输入码编码规则的跨平台,可有效提高翻译用户输入译文效率的一种云翻译输入法及系统。
云翻译输入法,包括以下步骤:
S1,从用户界面获取用户当前翻译的原文句子、用户已经输入的部分译文,以及当前的目标语言输入码;
S2,根据当前的目标语言、输入码编码规则及模糊码规则,对当前输入码根据概率词典进行输入码解码,将解码得到的词语及其概率放入候选词表;
S3,如果当前翻译的文本是专业文本,则对当前原文句子进行术语识别,根据所属专业领域的术语表,标识出句子中所包含的术语;
S4,对专业文本,从S3识别出的术语中筛选出与当前输入码相匹配的术语翻译加入候选词表,并设置较高的概率;
S5,根据原文、专业领域,以及用户已经输入的部分译文,调用机器翻译引擎自动翻译出原文句子剩余部分的译文;
S6,统计新生成的译文中出现的所有词语和短语,从中筛选出与当前输入码相匹配的词语或短语加入候选词表,并记录其翻译概率;
S7,按照各项概率及其权重,对候选词表进行重新排序,优先显示概率高的词语或短语;
S8,向用户界面返回候选词表,并支持用户自造词。
在步骤S2中,所述输入码解码的过程中支持模糊码规则,不仅支持双向模糊码(即一对模糊码中,二者可以任意互换使用),而且支持单向模糊码(即一对模糊码中,前者可以代表后者,但后者不能代表前者)。
本发明具有充分的通用性,只要提供概率词典、从特定源语言到目标语言的机器翻译引擎、相应的术语识别模块,所述云翻译输入法可适用于任何语言的任何输入码编码规则。
云翻译输入系统采用云服务的方式为用户提供云翻译输入法的功能。
云翻译输入系统设有客户端和服务器端;客户端设有控制模块和用户界面模块,用户界面模块的输入端与用户连接,用户界面模块与控制模块连接;服务器端设有通信接口模块、解码模块、术语识别模块和机器翻译模块;所述通信接口模块与客户端的控制模块连接,解码模块分别与通信接口模块、术语识别模块和机器翻译模块连接。
客户端程序执行步骤S1,并将用户当前翻译的原文句子、用户已经输入的部分译文,以及当前的输入码发送至服务器端;接收到服务器端返回的候选词表后,执行步骤S8。
服务器端程序接收客户端发送的内容,执行步骤S2~S7,并将候选词表返回客户端。
翻译输入系统支持用户自定义模糊码规则,具体为:
翻译输入系统采用基于云服务的架构实现,支持用户自定义的个性化模糊码规则。
所述翻译输入系统提供了用户自定义模糊码的界面,用户可以自行定义从任意输入码串到任意输入码串的单向或双向模糊码规则。客户端程序每次向服务器端发送请求时,会同时发送当前生效的模糊码规则。服务器端程序在执行权利要求1所述的步骤S2时能自动根据这些模糊码规则进行输入码的解码。
本发明通过获取原文信息,根据概率词典,利用支持交互式翻译的机器翻译引擎提供的带概率的翻译结果,扩充、重排候选词,支持单向和双向模糊码,适用于任何语言的任何输入码编码规则,
本发明与现有的翻译输入法相比,具有以下有益效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510288779.6/2.html,转载请声明来源钻瓜专利网。