[发明专利]网络搜索过程中关键词的智能纠错系统及方法无效
| 申请号: | 200710301710.8 | 申请日: | 2007-12-25 |
| 公开(公告)号: | CN101206673A | 公开(公告)日: | 2008-06-25 |
| 发明(设计)人: | 庄洪波;刘刚;刘建国;王洪涛;张研 | 申请(专利权)人: | 北京科文书业信息技术有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100011北京市东城区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 网络 搜索 过程 关键词 智能 纠错 系统 方法 | ||
技术领域
本发明涉及网络文本信息的智能处理领域,特别涉及在网络搜索过程中关键词信息的自动纠错、相关提示技术。
背景技术
在信息技术时代,通过互联网的手段来获取各种信息的方式在爆炸式增长,并日益成为人获取时信息和知识的主要途径。
在人们获取信息的同时,特别是有目的的去网络寻找自己想得到的信息的时候,都会使用到网络信息搜索系统,有时会不可避免地遇到一些问题。例如,在搜索系统运行过程中,用输入的一些关键词得不到查询结果,或者得到的查询结果密切度不大,其导致用户不能搜到满意的结果。其错误类型可归结为下表的五种情况。在表中,第1、2情况,可以归结为同音字错误,如大分歧密码(达芬奇密码)、莫明其妙(莫名其妙);第3种情况属于多字/漏字、字型、词型错误;第4、5种情况,用户会输入拼音,如chengxusheji(程序设计)、kaoyan2007(考研2007),在正常情况中,需要提示距确的中文。
对上述五种情况,目前常规的处理方法不能满足实际应用的需求。如通过预置错误词表的方法,尽可能把出现错误的词列举出来,并且给出正确的提示结果,但这种方法有其局限性,因为实际使用中出现的错词不一定都在错词表中,这就使部分词没有正确的提示结果。通过音字转换的方法,对错词只能做同音字的纠错,不能解决漏字、多字、错字情况;同时,常规的音字转换只做汉字的转换,不能处理拼音、数字和标点等混合情况。这些缺陷就给用户在网络搜索中因不能输入准确的关键词而导致不能提供想要的信息。
发明内容
针对上述问题,本发明提供了一种在网络搜索过程中提示正确的或最贴近关键词的系统及方法,提高了用户获取信息的感受。
本发明主要通过音字转换和模糊纠错技术手段来纠正用户输入的多音字错误、字型、词型错误,解决用户在输入过程中的字符替换错误、多字/漏字错误和字符位置错误等类型。并在此基础上扩展了基础功能,引入中英文、标点混合纠错,模糊匹配技术,相关提示技术,增强了智能纠错的功能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科文书业信息技术有限公司,未经北京科文书业信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710301710.8/2.html,转载请声明来源钻瓜专利网。





