[发明专利]一种适用于大信息量网站的搜索处理方法及装置无效

专利信息
申请号: 201010213386.6 申请日: 2010-06-28
公开(公告)号: CN102298594A 公开(公告)日: 2011-12-28
发明(设计)人: 苏宸琦 申请(专利权)人: 上海律闻商务咨询有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 上海科盛知识产权代理有限公司 31225 代理人: 赵继明
地址: 201111 上海*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 适用于 信息量 网站 搜索 处理 方法 装置
【说明书】:

技术领域

发明涉及一种搜索方法及装置,尤其是涉及一种适用于大信息量网站的搜索处理方法及装置。

背景技术

一、搜索引擎:

谷歌、百度、雅虎等一批先进技术领导的搜索引擎进入国内市场,对中文类网站的搜索效果已日渐成熟。基于中文搜索引擎内的搜索技术分为三部分:分词、搜索、排序。

分词:中文分词,是将一句话分成若干个关键词。该技术目前有2种方法:1)积累词库,该方法比较常用,且能随着词库的增加而更加完善程序本身功能。但缺点是,刚涉足搜索领域与企业内部软件没有足够的条件建立庞大的词库。2)智能分词技术,该技术仅存在于技术文献中,目前尚属于理论阶段。

搜索:搜索结果的有效程度,取决于分词的效果的完善程度。一个完善的分词功能,能够将一句复杂的中国话分离成几个正确的关键词进行搜索,极大的提高搜索效率。

排序:根据关键词在全文中的权重,通过复杂算法规避权重作弊,在搜索结果中的排序。经过时间的积累,计算搜索结果的准确率,微调关键词的权重。

二、站内模糊搜索:

站内模糊搜索,基于对用户输入的关键词,在数据库中进行“包含”的判断,来搜索数据内容,搜索结果按照已有元素排序。

搜索引擎的搜索技术,开发成本偏高,配置要求较高,对企业或个人用户往往很难将现有的搜索技术运用到自己的网站上做站内搜索。而站内搜索基于原理与算法的简单,但缺乏了搜索引擎关键词输入的自由度,同时忽略了搜索结果的排序。站内模糊搜索虽然可以普及,但对于数据量日趋庞大,站内搜索也将渐渐力不从心。

如上所述,互联网的搜索技术,处于二个分化的状态,一个高高在上,一个日趋淘汰。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种开发成本低、运行环境成本低、再次开发性和传播性良好的适用于大信息量网站的搜索处理方法及装置。

本发明的目的可以通过以下技术方案来实现:

一种适用于大信息量网站的搜索处理方法,其特征在于,包括以下步骤:

1)关键词冗余部分预处理;

2)关键词提取词库词语处理;

3)关键词分割处理,将助词作为基本分割词,分割成若干伪词语;

4)若步骤2)和步骤3)都未能处理的时,将关键词分割成一个一个的文字;

5)提交数据库进行内容查询,生成与关键词匹配的相关搜索结果;

6)内容筛选后,列出预处理查询结果,加亮匹配的文字;

7)计算权重,根据匹配文字的并列程度或根据关键词在文中的密度来计算;

8)根据权重排序;

9)将排序结果输出,分辨词语并加以记录;

10)根据最终用户选定的内容,微调搜索结果的排序。

一种适用于大信息量网站的搜索处理装置,其特征在于,包括服务器群、电信机房、主干网络出口端、通信网络、终端群,所述的服务器群、电信机房、主干网络出口端、通信网络、终端群依次连接。

所述的服务器群包括主控服务器、INTNET信息服务器、数据库服务器。

与现有技术相比,本发明具有以下优点:

1)开发成本低;

2)运行环境成本低;

3)采用软件基础技术作为载体,具有良好的再次开发性;

4)采用最常用的开发语言与数据库结构,可以方便的移植为各语言版本,具有良好的传播性。

附图说明

图1为本发明的流程图;

图2为本发明的硬件结构示意图。

具体实施方式

下面结合附图和具体实施例对本发明进行详细说明。

实施例

如图1所示,一种适用于大信息量网站的搜索处理方法,包括以下步骤:

1.关键词冗余部分预处理,去除对搜索没用帮助的空格等元素;

2.关键词提取词库词语处理;

3.关键词分割处理,将助词作为基本分割词,分割成若干伪词语;

4.在步骤2和步骤3都未能处理的时候,将关键词分割成一个一个的文字;

5.提交数据库进行内容查询,生成与关键词匹配的相关搜索结果;

6.内容筛选后,列出预处理查询结果,加亮匹配的文字;

7.计算权重,根据匹配文字的并列程度或根据关键词在文中的密度来计算;

8.根据权重排序;

9.将排序结果输出,分辨词语并加以记录;

30.根据最终用户选定的内容,微调搜索结果的排序。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海律闻商务咨询有限公司,未经上海律闻商务咨询有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201010213386.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top