[发明专利]字典学习方法以及使用该方法的装置,输入方法以及使用该方法的用户终端装置有效

专利信息
申请号: 200810086789.1 申请日: 2005-01-31
公开(公告)号: CN101266599A 公开(公告)日: 2008-09-17
发明(设计)人: 许荔秦;薛敏宇 申请(专利权)人: 日电(中国)有限公司
主分类号: G06F17/27 分类号: G06F17/27
代理公司: 中科专利商标代理有限责任公司 代理人: 罗松梅
地址: 100007北京市东城区东四十*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 字典 学习方法 以及 使用 方法 装置 输入 用户 终端
【说明书】:

技术领域

发明涉及一种自然语言处理,更具体地,涉及一种字典学习方法以及使用该字典学习方法的装置,输入方法以及使用该输入方法的用户终端装置。

背景技术

随着计算机、PDA以及移动电话在中国的广泛应用,可以看出这些装置的一个重要特征在于能够使用户实现中文输入。在中国目前的移动终端市场,几乎每一个移动电话都提供利用数字键盘的输入方法。当前最广泛使用的输入方法为T9以及iTap。利用这种输入方法,用户可以使用十按键数字键盘输入汉字的拼音或笔画。附图8A-8B示出用于拼音和笔画输入的示例键盘。该输入方法根据用户敲击的按键顺序给出汉字预测。当用户输入一个汉字的拼音时,用户不需要按照最常规的输入方法点击按键三到四次输入每个正确的字母。用户仅需要根据该汉字的拼音点击一系列按键,则输入方法就会在一个候选列表中预测出正确的拼音和正确的汉字。例如,用户想利用拼音“jin”输入“今”,他不需要通过敲击“5”(代表“jkl”)1次来输入“j”,敲击“4”(代表“ghi”)3次以及敲击“6”(代表“mno”)2次,然而,他仅需敲击“546”则输入方法将给出预测拼音“jin”以及对应的预测候选汉字“进今金…”.图9A示出利用最传统的输入方法输入汉字“今”的T9的输入序列。

对于当前的移动终端来说,用户必须逐字地输入汉字。虽然一些输入方法宣称可以根据用户输入给出预测结果,但实际上,这些输入方法是逐字地给出预测的。对于每个汉字,用户需要点击按键若干次,并至少进行一次拼写核对。鉴于此,本发明的发明人提供一种可以给出句子级以及词级的预测的系统。

如上所述,目前T9和iTap是移动终端上最为广泛使用的输入方法。然而,这些输入方法的速度不能够令大多数的用户满意。需要多次点击以及多次交互,即使仅输入单个汉字。

存在上述问题的主要原因在于应用中文输入方法的当前大部分数字键盘仅仅是基于汉字的(US 20030027601)。这是因为在汉字中,在词之间并不存在清晰的界限。此外,对词也没有明确的定义。因此,这些输入方法选择将单个汉字看作是与其英文相对应的“词”。然而,这将不可避免地导致依据单个汉字的数字序列的大量的冗余汉字,速度也因此明显的降低。此外,由于仅能根据单个汉字获得预测,所以基于汉字的输入方法在很大程度上限制了词预测的效果。也就是说,当前移动终端中所采用的输入方法仅能够将用户输入的数字序列转换为汉字候选列表。用户必须从候选列表中选出正确的汉字。用户不能够连续地输入一个词或一个句子。

例如,用户想输入词“今天”。首先,用户使用数字键盘输入“546”,其表示汉字“今”的拼音“jin”。然后,向用户显示候选列表“进今金...”。其次,用户必须从该列表中选出正确的汉字“今”.然后,向用户显示可以跟随在汉字“今”之后的候选列表“天日年...”。用户必须从该列表中选出正确的汉字“天”。图9B示出输入汉字词“今天”的T9的输入序列。

在PC平台中,存在基于PC键盘的多种高级快速输入方法,诸如微软拼音,紫光拼音以及智能狂拼等。其中的一些方法可以给出句子级的预测,所有的上述方法可以给出词级的预测。但是对于这些可以给出句子级预测的方法来说,字典的尺寸太大。例如,微软拼音输入的字典大小为20~70MB,智能狂拼所需要的存储空间达到100MB。它们都采用统计语言模型(SLM)技术来形成可以进行句子预测的基于词的SLM(典型地是词双元模型或词三元模型)。然而这种SLM使用了预定的词典并在字典中存储了大量的词双元词条和词三元词条,字典的尺寸将会不可避免地太大,从而不能够安装在移动终端上。此外,在移动终端平台上的预测速度也非常慢。

另一个不利之处在于大多数的输入方法没有词典或仅包括预定的词典。因此,不能够连续地输入在语言中频繁使用的多个重要的词和短语,如“今天下午”。

发明内容

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于日电(中国)有限公司,未经日电(中国)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200810086789.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top