[发明专利]一种ElasticSearch查询加速方法有效
申请号: | 201710102541.9 | 申请日: | 2017-02-24 |
公开(公告)号: | CN108509437B | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 王磊;王胤然;徐寅;穆宁 | 申请(专利权)人: | 南京烽火星空通信发展有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33;G06F16/22;G06F16/2455;G06F16/182 |
代理公司: | 常州佰业腾飞专利代理事务所(普通合伙) 32231 | 代理人: | 李杰 |
地址: | 210019 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种ElasticSearch查询加速方法,计算机大数据索引技术领域,分发明首先为每个字段增加Payload载荷域,然后再通过Payload载荷域在单一子查询条件的基础上做过滤操作,解决了ES原始数据查询时如果各个结果集数据量很大,取交集和并集的计算会占用大量时间的问题,提高了索引效率。 | ||
搜索关键词: | 一种 elasticsearch 查询 加速 方法 | ||
【主权项】:
1.一种ElasticSearch查询加速方法,其特征在于:包括如下步骤:步骤1:建立全文索引系统,全文索引系统包括Hadoop存储服务器集群、WEB界面服务器、数据导入服务器和数据采集终端,数据采集终端通过互联网连接数据导入服务器,WEB界面服务器和数据导入服务器均通过互联网连接Hadoop存储服务器集群;步骤2:通过Lucene全文信息检索工具在Hadoop存储服务器集群中建立全文检索平台,并且通过Lucene全文信息检索工具在Hadoop存储服务器集群中分配出ES集群;步骤3:数据采集终端将流数据或文本数据输入到数据导入服务器,数据倒入服务器将流数据或文本数据发送给Hadoop存储服务器集群进行存储;步骤4:ES集群通过Lucene全文信息检索工具为Hadoop存储服务器集群存储的数据建立倒排文件索引结构的索引数据表,ES集群为索引数据表提供存储用的字段区;所述存储用的字段区中包含多个文档号存储字段区;步骤5:根据Lucene全文信息检索工具提供的底层存储结构,ES集群在倒排表链表中添加多个Payload载荷域,所有Payload载荷域均设于文档号存储字段区后边;步骤6:用户通过WEB界面服务器输入查询条件,WEB界面服务器将查询条件传送给ES集群;所述查询条件包括精确查询条件、范围查询条件、前缀查询条件和Payload范围查询条件;步骤7:ES集群通过Lucene全文信息检索工具首先根据精确查询条件、范围查询条件和前缀查询条件进行检索,相应得出精确查询结果、范围查询结果和前缀查询结果;步骤8:ES集群根据Payload范围查询条件分别对精确查询结果、范围查询结果和前缀查询结果进行过滤,得到精确查询结果集、范围查询结果集和前缀查询结果集;步骤9:ES集群将精确查询结果集、范围查询结果集和前缀查询结果集做交集计算,得出最终检索结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京烽火星空通信发展有限公司,未经南京烽火星空通信发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710102541.9/,转载请声明来源钻瓜专利网。