[发明专利]生成拼写建议的方法和系统有效
申请号: | 200680013480.9 | 申请日: | 2006-03-14 |
公开(公告)号: | CN101371253A | 公开(公告)日: | 2009-02-18 |
发明(设计)人: | D·W·波特;E·C·小哈特;五十岚久和;P·M·舒米德;W·D·拉姆瑟 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/27 | 分类号: | G06F17/27;G06F17/28 |
代理公司: | 上海专利商标事务所有限公司 | 代理人: | 陈斌 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生成 拼写 建议 方法 系统 | ||
发明领域
本发明一般涉及拼写检查方法和系统,尤其涉及被配置成基于输入串中的单词对输入串的单词建议替换的拼写检查方法和系统。
发明背景
文字输入,诸如使用文字处理应用程序所生成的文档中的文字输入可包含众多不同类型的错误,包括拼写错误。导致无效单词的拼写错误一般可由基于词典的拼写检查器来处理。这样的拼写错误可能因排印错误或不知道单词的拼写而发生。
基于词典的拼写检查器将文字输入中的单词与单词的词典进行比较,并标识文字输入中未在词典里找到的单词。通常为拼错的单词建议一个或多个替换单词。例如,在文字输入“fly frm Boston”中,拼写检查器可将“frm”标识为拼错。
其它类型的拼写错误会导致使用传统拼写检查应用程序一般无法检测的有效单词。例如,可能由文字处理应用程序的用户因排印错误或不知道想要的单词的拼写而输入不是想要的有效单词。例如,在文字输入“fly form Boston”中,单词“form”是常规拼写检查应用程序不会标记的有效单词,即使该单词是想要的单词“from”的错拼。对这些类型的拼写错误的更正一般需要对使用该单词的上下文作分析。
传统的拼写检查应用程序一般基于编辑距离提出对所标识的无效单词所建议的替换单词。编辑距离表示形成有效替换单词所需的改变。词典中与所键入的无效单词编辑距离最短的单词是向用户建议的第一替换单词。例如,在短语“fly frmBoston”中,大多数拼写检查应用程序在建议正确单词“from”之前都会建议“form”作为替换单词,因为当作出建议时没有考虑单词的上下文。为了为拼写错误建议最合适的替换单词,必须对其中找到拼写错误的上下文进行分析。
从而,需要能够分析其中使用单词的上下文以便提供对拼错单词的更好建议以及对不正确使用的有效单词改进的检测的改进的拼写检查方法和系统。
本发明的实施例对这些和其它问题提供了解决方案,并提供了优于现有技术的其它优点。
发明概述
本发明一般涉及利用包括主题单词和候选替换单词对以及每一对的候选得分的候选表并基于该表作出单词替换建议的拼写检查方法和系统。
本发明的一个方面涉及对串中单词建议替换单词的计算机实现方法。在该方法中,接收到输入单词的输入串。然后将输入单词与候选表的主题单词进行匹配。接着,从候选表中提取对应于所匹配的主题单词的候选替换单词和候选得分。每一候选得分指示应使用相应的候选替换单词替换输入单词的概率。最后,基于替换单词的候选得分选择性地建议使用其相应的候选替换单词替换输入单词。
本发明的另一方面针对用于对输入串中的输入单词建议替换单词的拼写检查系统。该系统包括候选生成器和上下文拼写引擎。候选生成器包括为匹配候选表的主题单词的每一输入单词输出候选替换单词及相应的候选得分。每一候选得分指示应使用相应的候选替换单词替换输入单词的概率。上下文拼写引擎包括基于相应的候选得分为输入单词选择性地输出候选替换单词。
本发明的又一方面针对形成供拼写检查系统使用来为输入串中的输入单词建议替换单词的候选表的方法。在该方法中,提供单词的词典。接着,将词典中的主题单词与词典中的其它单词进行比较。然后基于比较为主题单词标识候选替换单词。然后形成包括所标识的主题单词及其相应的候选替换单词对的候选表。最后,在计算机可读介质上存储该候选表。
当阅读了以下详细描述并审阅了相关联的附图之后,表现本发明的实施例的其它特征和好处将是显而易见的。
附图简述
图1是可在其中实现本发明的计算环境的框图。
图2是根据本发明的实施例示出为串中的单词建议替换单词的方法的流程图。
图3是根据本发明的实施例的拼写检查系统的框图。
图4是根据本发明的实施例示出生成供拼写检查系统使用来为输入串的输入单词建议替换单词的候选表的方法的流程图。
说明性实施例的详细描述
本发明一般涉及用于为输入串中的无效输入单词提供准确的替换单词建议的拼写检查方法和系统。此外,本发明的拼写检查方法和系统可为输入串中不正确使用的有效输入单词提供替换单词建议。本发明的实施例基于使用输入单词的上下文来作出替换单词建议。
在详细描述本发明之前,将提供可在其中使用本发明的示例性计算环境的讨论。
示例性计算环境
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680013480.9/2.html,转载请声明来源钻瓜专利网。