[发明专利]分布式集群索引分片的评估方法及装置、电子设备有效
申请号: | 201810698652.5 | 申请日: | 2018-06-29 |
公开(公告)号: | CN108897858B | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 任娜;王立新 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分布式 集群 索引 分片 评估 方法 装置 电子设备 | ||
本发明公开了一种分布式集群索引分片的评估方法及装置、电子设备,所述方法包括:获取业务方所选定的集群的配置信息以及业务方指定的单个索引的数据量的预估值;获取分布式集群的节点配置信息;根据集群的配置信息、单个索引的数据量的预估值以及节点配置信息,计算得到单个索引的分片数量区间。利用上述方案可以使索引分片等技术问题对用户透明,用户不需要了解分布式集群本身的运行以及性能相关问题,直接根据选定的配置信息及业务索引数据量的预估值,可以得到索引的分片数量区间,方便用户根据分片数量区间建立对应的索引,提高索引建立的合理性,有效避免业务发展可能出现的性能问题。
技术领域
本发明涉及软件领域,具体涉及一种分布式集群索引分片的评估方法及装置、电子设备。
背景技术
分布式搜索服务器,如ElasticSearch(以下简称ES),可以利用分布式集群提供分布式多用户能力的全文搜索引擎,能够达到实时搜索,稳定、可靠、快速。ES可以把一个完整的索引分成多个分片,这样的好处是可以把一个大的索引拆分成多个,分布到不同的节点上,使得一个索引可以存储超过一个节点容量的数据,从而构成分布式集群搜索。但ES本身限定了只能在索引创建时一次指定分片的数量,在索引创建后分片数量不能再进行更改。因此,在建立索引时,需要预先考虑如何创建合理的分片数量,如过度分片,每个分片都是有额外的成本的,当建立的分片数量过多,分片开始竞争相同的硬件资源时,性能便会逐步下降;同时,增大了合并分片查询结果时的复杂度,增大了查询耗时;且如果在大量分片上只维护了很少的数据,则将导致最终的文档相关性较差。当分片数量过少时,分片本身过大,可能会对分布式集群从故障中恢复的能力产生负面影响。当分片的数量建立不合理时,只能重新创建索引,又使得整个过程耗时较多且影响业务使用。
基于上述问题,使得用户在建立索引时,需要先了解ES应如何设置分片,对用户限定了技术门槛要求。但实际在建立索引时,很多用户往往只想得到明确的分片数量,甚至都不关心随意的设置可能带来的问题。但现有技术还不能使用户直接得到合理的分片数量。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的分布式集群索引分片的评估方法及装置、电子设备。
根据本发明的一个方面,提供了一种分布式集群索引分片的评估方法,其包括:
获取业务方所选定的集群的配置信息以及业务方指定的单个索引的数据量的预估值;
获取分布式集群的节点配置信息;
根据集群的配置信息、单个索引的数据量的预估值以及节点配置信息,计算得到单个索引的分片数量区间。
根据本发明的另一方面,提供了一种分布式集群索引分片的评估装置,其包括:
获取模块,适于获取业务方所选定的集群的配置信息以及业务方指定的单个索引的数据量的预估值;
节点获取模块,适于获取分布式集群的节点配置信息;
分片计算模块,适于根据集群的配置信息、单个索引的数据量的预估值以及节点配置信息,计算得到单个索引的分片数量区间。
根据本发明的又一方面,提供了一种电子设备,包括:处理器、存储器、通信接口和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;
存储器用于存放至少一可执行指令,可执行指令使处理器执行上述分布式集群索引分片的评估方法对应的操作。
根据本发明的再一方面,提供了一种计算机存储介质,存储介质中存储有至少一可执行指令,可执行指令使处理器执行如上述分布式集群索引分片的评估方法对应的操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810698652.5/2.html,转载请声明来源钻瓜专利网。