[发明专利]电子设备的文本输入系统及文本输入方法有效
申请号: | 201080051346.4 | 申请日: | 2010-10-11 |
公开(公告)号: | CN102640089A | 公开(公告)日: | 2012-08-15 |
发明(设计)人: | 本杰明·麦德洛克;乔纳森·雷诺兹 | 申请(专利权)人: | 触摸式有限公司 |
主分类号: | G06F3/023 | 分类号: | G06F3/023 |
代理公司: | 北京华夏正合知识产权代理事务所(普通合伙) 11017 | 代理人: | 韩登营;栗涛 |
地址: | 英国*** | 国省代码: | 英国;GB |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 电子设备 文本 输入 系统 方法 | ||
技术领域
本发明涉及电子设备的文本输入系统及文本输入方法,特别是指一种文本预测自适应加权的文本输入系统及文本输入方法。
背景技术
目前,存在着大量的电子设备文本输入技术,例如,台式电脑或笔记本电脑的标准键盘文本输入,PDA(个人数字助理)市场中的手写识别,使用移动电话9位数字键的字母字符输入,标准及移动计算装置的语音识别文本输入系统,以及触屏装置。
在移动电话技术中,有一些现存的文本输入技术,其中比较有名的文本输入技术包括特捷通讯公司(Tegic Communications)的“T9”,摩托罗拉(Motorola)的“iTap”,Nuance通讯公司的“XT9”、“eZiType”和“eZiText”,黑莓的“SureType”,KeyPoint科技公司(KeyPoint Technology)的“AdapTxt”和上海汉翔信息技术有限公司(CooTek)的“TouchPal”。这些技术大多是基于字符的文本输入技术,并利用了一些文本预测(或歧义消除)技术。在不同的已知模型中,支持一本具有合法词条的词典(或多本词典),并且词典被赋予特定的输入序列,文本输入系统从该词典中选择一条(或一组)合法的词条,并将该词条作为潜在填充的候选词条呈现给用户。可由用户输入新的词条来扩充上述基础词典,这一扩充受限于设备的可用内存容量。
在这些文本输入系统中,根据使用频率的统计,在某些系统(诸如“eZiText”、“AdapTxt”、“TouchPal”)中根据即时的词汇语境,对潜在填充的候选词条进行排序。
发明内容
本发明对这种仅以使用时间或频率为依据进行文本预测排序的文本输入系统进行了显著的改进,其允许对受到已生成的诸如主题、类型或作者等高层文本特征影响的文本预测进行排序。
本发明由此提供了一个更加精确的文本输入系统文本预测的排序方法,从而降低了用户的文本输入强度(因为用户基本不必滚动预测词条列表或输入额外字符来找出他们的目标词条)。
本发明提供了一种具有机器学习技术和分类能力的系统,以便对用户输入的文本片段做出实时的分类预测。该系统使用分类预测重新排序和/或选择由文本预测引擎生成的文本预测。然后将生成的文本预测呈现给用户,以供用户选择输入电子设备中的输入文本。
利用分类预测对文本预测进行重新排序具有以下优点,可将那些与当前文本主题/类型等最为相关的文本预测置于显示列表的顶部供用户选择。由此使用户的文本输入更加便利。可将所述分类预测分级,以划分出宽泛的分类,并在该分类中提取出精炼分类的文本预测。举例来说,可将宽泛的“体育”分类划分为任意数量的子类,并可继续划分这些子类。假设“体育”的一个子类为“足球”,则可将“足球”这一子类进一步划分为“足球俱乐部”、“球员”、“球队经理”等子类。因此,本发明提供的文本输入系统能够从用户输入的文本中精确地预测出与该文本相关的分类。在此之后,该文本输入系统可以通过减少不大可能出现在用户输入文本的给定分类文本预测中的文本预测的出现概率,来精炼由文本预测引擎(该引擎优选生成基于字符的文本预测)生成的文本预测。
本发明提供了一种计算装置的文本输入系统,该系统包括具有至少一个预测器的文本预测引擎,用于接收用户输入至计算装置中的文本并使用所述预测器生成多条文本预测;分类器,用于接收输入文本并生成至少一个文本预测分类;以及,加权模块,用于接收所述文本预测和所述文本预测分类并使用所述文本预测分类加权所述文本预测以生成新的文本预测呈现给用户。
优选地,根据文本源训练所述预测器。所述系统包括多个由单独文本源训练的预测器。优选地,多个所述预测器同时生成多条文本预测。
在本发明的一个实施例中,所述系统还包括特征向量生成器,该特征向量生成器用于通过从所述输入文本中提取特征,计算所述输入文本中每个特征的词条逆向文档频率并标准化结果向量为单位长度,来生成用以表示由用户输入至所述计算装置中的文本输入的特征向量。优选地,所述特征向量生成器还用于通过从所述文本源中提取一组特征,计算所述输入文本中每个特征的词条逆向文档频率并标准化结果向量为单位长度,来为所述文本源或每个单独文本源生成至少一个特征向量。
在本发明的一个优选实施例中,所述系统还包括分类器训练模块,该模块用于根据所述文本源生成的特征向量训练所述分类器。优选地,所述文本源包括至少用一个代表分类预先标记的文本数据。所述分类器可以是时序聚集感知分类器。优选地,所述分类器用于生成与所述分类相关的置信度向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于触摸式有限公司,未经触摸式有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080051346.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种异形零件弯曲治具
- 下一篇:一种发电机通风网板