[发明专利]因特网信息资源快速检索方法有效
申请号: | 201310492732.2 | 申请日: | 2013-10-21 |
公开(公告)号: | CN103530384B | 公开(公告)日: | 2017-01-25 |
发明(设计)人: | 史高升;朱涛;赵西法;韩祥松;荣丽萍 | 申请(专利权)人: | 政和科技股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 济南诚智商标专利事务所有限公司37105 | 代理人: | 王汝银 |
地址: | 250101 山东省济南市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 因特网 信息资源 快速 检索 方法 | ||
技术领域
本发明涉及因特网信息检索领域,具体说是一种因特网信息资源快速检索方法。
背景技术
随着互联网技术的不断发展,以搜索引擎为首的互联网应用,在日益广泛渗透到中国经济、文化、政治生活的各个领域。网络信息资源具有数量巨大,更新迅速的特点,如何在海量的互联网信息中快速准确的检索出人们所需要的信息资源是互联网企业改进的方向。目前,搜索信息是从数据库中进行搜索,每个数据库都很大,因此搜索时间长,而且在数据更新后,更新的数据与原有的数据混合到一个新的数据库中,这样搜索起来更加麻烦。
发明内容
为了克服上述现有技术存在的缺点,本发明的目的在于提供一种实现分块索引,提升索引速度的因特网信息资源快速检索方法。
为了解决上述问题,本发明采用以下技术方案:一种因特网信息资源快速检索方法,包括以下步骤:
S1,定义一套索引文件格式,建立文档类,用于存放文件索引及索引范围的记录;
S2,将数据库中的目标文件转换为二进制文件,生成索引目录,并在索引目录前进行编号,其中,所述目标文件包括网页、文件和数据库记录;
S3,建立字段描述类,用于存放单个字段的各种属性;
S4,在文档被索引之前,首先对文档内容进行分词处理;
S5,把每个索引文档加入到与其对应的文档对象中;
S6,将用户查找的关键字封装成所在二进制文件易于识别的形式;
S7,建立一个用户保存搜索结果的对象,用于用户保存查找结果;
S8,解析用户输入的搜索关键字,根据关键字排他字典对关键字进行处理;
S9,建立数据转化类,将搜索结果转化为网页显示所需要的格式;
S10,通过套用显示模板,把搜索结果转化成页面展示所需的格式。
当增加新的数据记录文件时,S1步骤中建立一个小文件索引,所述小文件索引与原有的文件索引为并列关系。
S1步骤中定义的索引文件格式为8位字节或16位字节。
本发明的有益效果是:它通过建立文档类,较以前的数据库分类更细,实现了分块检索,大大提升了检索速度,而且,在有新的数据产生时,会把新数据建立一个小文件索引,它与原有的索引文件并列,这样就加快了对新数据的索引速度。
附图说明
下面结合附图和实施例对本发明做进一步的说明:
图1为本发明的流程框图;
图2为本发明的系统结构示意图。
具体实施方式
如图1所示,本发明的一实施方式包括一下步骤:
S1,定义一套索引文件格式,建立文档类,用于存放文件索引及索引范围的记录;
S2,将数据库中的目标文件转换为二进制文件,生成索引目录,并在索引目录前进行编号,其中,所述目标文件包括网页、文件和数据库记录;
S3,建立字段描述类,用于存放单个字段的各种属性;
S4,在文档被索引之前,首先对文档内容进行分词处理;
S5,把每个索引文档加入到与其对应的文档对象中,方便后续的查找操作;
S6,将用户查找的关键字封装成所在二进制文件易于识别的形式;
S7,建立一个用户保存搜索结果的对象,用于用户保存查找结果;
S8,解析用户输入的搜索关键字,根据关键字排他字典对关键字进行处理,去掉一些如“的”、“吗”等语助词;
S9,建立数据转化类,将搜索结果转化为网页显示所需要的格式;
S10,通过套用显示模板,把搜索结果转化成页面展示所需的格式。
如图2所示,用户通过索引页进行检索,文件索引中的目录进行编号,搜索范围记录也进行编号,当增加新数据时,生成新数据的小文件索引,它与原有文件索引并列,使检索过程更加快捷;在对目标文件(包括网页、文件、数据库记录等)进行检索后,通过数据转化类,进行算法和对应关系,将搜过结果转化为网页显示所需要的格式后返回结果,进行显示。
本发明具有一下特点:
1、索引文件格式独立于应用平台。本发明定义了一套8位字节为基础的索引文件格式,当然也可以使16位等其他位数字节,使得兼容系统或者不同平台的应用能够共享建立的索引文件。
2、在传统文件检索引擎的倒排索引的基础上,实现了分块检索,能够针对新的文件建立小文件索引,提升索引速度,然后通过索引的合并,达到优化目的。
3、优秀的面向对象的系统构架,使得本搜索扩展的学习难度降低,方便扩充信功能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于政和科技股份有限公司,未经政和科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310492732.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:贯流机组转轮室汽蚀焊补工艺
- 下一篇:树形结构数据显示方法与装置