[发明专利]一种基于搜索引擎技术的数据库检索方法在审
申请号: | 201310734758.3 | 申请日: | 2013-12-27 |
公开(公告)号: | CN103744913A | 公开(公告)日: | 2014-04-23 |
发明(设计)人: | 劳定雄;吴仲谋;陈刚;蔡青 | 申请(专利权)人: | 高新兴科技集团股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 邱奕才;廖继海 |
地址: | 510530 广东省广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 搜索引擎 技术 数据库 检索 方法 | ||
技术领域
本发明涉及信息检索技术,尤其涉及一种基于搜索引擎技术的数据库检索方法。
背景技术
目前对关系型数据库的内容进行检索,一般编写SQL查询语句,让数据库系统来执行。但对于记录条数较多的情况,例如上亿条,数据库执行检索的效率很低。
为了提高检索效率,目前采用的技术方法都是围绕数据库本身进行优化,包括:1.对经常需要作为检索条件的字段建立索引;2.将大的数据库表进行分区或分表处理,再结合应用逻辑的优化来提高对部分数据进行检索的效率。
然而,创建索引和分区分表虽能提升对关系型数据库进行内容检索的效率,但是数据库系统也需要承受很大的代价,说明如下:
由于关系型数据库的特性,在相关的字段建立索引之后,会导致数据库其它操作的性能下降,例如插入、更新、删除等;而且,当检索条件复杂的情况,需要对较多的字段建立索引,性能代价将会更大。另外,对数据库进行分区和分表之后,如果需要在全局的数据中进行检索,仍然要面临数据合并和排序的性能问题。
发明内容
为了克服现有技术的不足,本发明提供了一种基于搜索引擎技术的数据库检索方法,它不影响原有数据库系统的性能,通过额外增加检索服务器,利用搜索引擎的技术,对数据库的内容提供高性能的检索服务。
本发明采用如下技术方案:
一种基于搜索引擎技术的数据库检索方法,所述方法包括:
S1.设置一个带有服务接口的检索服务器,用于提供辅助的快速检索服务,所述检索服务器从关系型数据库中获取数据并建立索引;
S2.客户端通过服务接口向检索服务器发送检索请求;
S3.检索服务器根据检索条件获取检索结果然后通过服务接口把检索结果发送给客户端;
S4.客户端对返回的结果进行处理显示。
本发明主要通过额外增加检索服务器对关系型数据库中新增加的数据进行索引建立,然后让客户端在检索服务器里面快速获取想要的数据信息,这样比起原先直接在关系型数据库里检索的速度大大提高了,因为关系型数据库随着新的数据进入,当数据量增长到一定程度时会使它的处理性能遭遇到瓶颈,使得检索速度变得很缓慢,而采用的这样的检索服务器来响应客户端的请求就很快捷。
其中,所述检索服务器从关系型数据库中获取数据并建立索引具体包括:
S11.检索服务器根据设定的时间间隔,结合最近一次获取数据的时间戳,定时从关系型数据库中获取更新的数据;
S12.对新的数据进行分词处理;
S13.根据分词和文档的包含关系,建立倒排索引,并写入结构紧凑的索引文件中。
其中,对于步骤S13,当索引文件增加到一定程度时,对其进行合并。
结合步骤S13,步骤S4提到客户端对返回的结果进行处理显示具体是本发明在对新的数据做了分词之后,只保留倒排索引,不保留原始全部信息,这样检索服务器发送给客户端的检索结果为数据满足检索条件且记录在关系型数据库中的位置信息,然后客户端再根据这位置信息去关系型数据库里快速获取详细的数据信息。但是,这种只是配置方式的一种,检索服务器中保留和返回哪些原始信息,这个可以根据实际需要配置,也即检索服务器也可以保留更新数据的全部信息,然后根据检索条件把全部信息发送给客户端。
另外,本发明对不同字段的数据类型采用相应的索引方法,对文本则对其分词后再根据分词来建立索引,对数值则采用二叉树进行存储。
其中,对于步骤S3,根据检索条件,在索引文件中查找满足条件的内容,一般根据相关性对其进行排序,也可以根据用户指定的条件进行排序。
为了达到高性能的目的,需要尽量将索引文件保持在检索服务器的内存中,除了合理设计索引文件的存储格式之外,本发明还设有缓存机制,将检索条件中包含取值区间的检索结果缓存到检索服务器的内存中,使得后续的相似查询可以获得更快速的响应。
本发明与现有技术相比具有的有益效果为:
1.额外增加的检索服务器在不影响原有客户端的前提下,实现高效率的检索功能。
2.良好的缓存机制使得相似检索可以得到更快的相应。
附图说明
图1:本发明的流程图。
具体实施方式
下面结合附图对本发明作进一步描述。
结合图1所示,一种基于搜索引擎技术的数据库检索方法,所述方法包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高新兴科技集团股份有限公司,未经高新兴科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310734758.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:植保喷肥机排肥组件
- 下一篇:一种钵苗移栽机穴盘苗可控取投末端执行器