[发明专利]网络搜索过程中关键词的智能纠错系统及方法无效

申请号：	200710301710.8	申请日：	2007-12-25
公开（公告）号：	CN101206673A	公开（公告）日：	2008-06-25
发明（设计）人：	庄洪波;刘刚;刘建国;王洪涛;张研	申请（专利权）人：	北京科文书业信息技术有限公司
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	暂无信息	代理人：	暂无信息
地址：	100011北京市东城区***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种网络搜索过程中关键词的智能纠错系统及方法，在互联网络平台上，首先，通过相关数据信息的训练，建立相关的语言模型、对应的词典和数据索引数据库；然后，输入文本，拼音纠错部分计算音字错误，模糊匹配计算词型纠错；最后，将所有结果进行相关度过滤，对多个结果进行排序，得到最接近的几个结果。通过音字转换和模糊纠错技术手段来纠正用户输入的多音字错误、字型、词型错误，解决用户在输入过程中的字符替换错误、多字/漏字错误和字符位置错误等类型。并在此基础上扩展了基础功能，引入中英文、标点混合纠错，模糊匹配技术，相关提示技术，增强了智能纠错的功能。
搜索关键词：	网络搜索过程关键词智能纠错系统方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种网络搜索过程中关键词的智能纠错系统，是在互联网络平台上，首先，通过相关数据信息的训练，建立相关的语言模型、对应的词典和数据索引数据库；然后，输入文本，拼音纠错部分计算音字错误，模糊匹配计算词型纠错；最后，将所有结果进行相关度过滤，对多个结果进行排序，得到最接近的几个结果。该系统包括以下部分：文本语料数据库模块：对数据库中的数据进行分析、规范和初始化，作为训练语料；切分字符模块：包括初始化相应的训练词典，并对训练文本信息进行分词处理；统计语言模型模块：对切分后的训练文本计算，得到词的概率模型和词间的转移概率模型；建立索引模块：建立训练语料中词和文档位置的索引；规范提示信息模块：对训练数据进行规范化处理，得到可能作为提示结果的规范化信息；输入搜索信息模块：在输入界面输入相应的文字；拼音纠错模块：切分字音转换后的字符串，按照切分单位做拼音到汉字的转换，使用动态规划的算法，取得概率较大的几个结果；词型匹配模块：根据模糊匹配的原理，匹配相关的字词，得到多个相近的结果；相关度过滤模块：对拼音纠错结果和词型纠错结果作相关度计算，并使用训练语料计算的索引过滤结果；最后显示结果模块：输出关键词的提示结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京科文书业信息技术有限公司，未经北京科文书业信息技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/200710301710.8/，转载请声明来源钻瓜专利网。

上一篇：一种内服用于治疗伤寒头痛的中药汤剂
下一篇：一种含表面活性剂的防结块剂及其制造方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]网络搜索过程中关键词的智能纠错系统及方法无效

专利文献下载