[发明专利]索引系统的构建方法、搜索的实现方法及装置有效
申请号: | 201610151332.9 | 申请日: | 2016-03-16 |
公开(公告)号: | CN107203532B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 肖建冰 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F16/953 | 分类号: | G06F16/953 |
代理公司: | 北京展翅星辰知识产权代理有限公司 11693 | 代理人: | 王文生 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 索引 系统 构建 方法 搜索 实现 装置 | ||
1.一种索引系统的构建方法,其中,所述方法包括以下步骤:
获取需要进行索引处理的数据文档;
为所述数据文档设置用于唯一标识数据文档的文档标识,并从所述数据文档中获取用于构建索引的信息;
根据所述用于构建索引的信息以及文档标识在搜索引擎服务系统中为所述数据文档构建索引;
将所述数据文档和文档标识存储于数据存储服务系统中;
其中,所述搜索引擎服务系统包括多台基于固态硬盘的服务器,所述数据存储服务系统包括多台基于机械硬盘的服务器;
所述根据所述用于构建索引的信息以及文档标识在搜索引擎服务系统中为所述数据文档构建索引的步骤包括:
对所述文档标识进行哈希运算;
根据哈希运算的结果确定所述数据文档对应的基于固态硬盘的服务器;
根据所述用于构建索引的信息以及文档标识在所述对应的基于固态硬盘的服务器中为所述数据文档构建索引;
所述将所述数据文档和文档标识存储于数据存储服务系统中的步骤包括:
对所述文档标识进行哈希运算;
根据哈希运算的结果确定所述数据文档对应的基于机械硬盘的服务器;
将所述数据文档和文档标识存储于所述数据文档对应的基于机械硬盘的服务器中。
2.根据权利要求1所述的方法,其中,所述为所述数据文档设置用于唯一标识数据文档的文档标识的步骤包括:
为所述数据文档设置通用唯一标识码UUID。
3.根据权利要求1所述的方法,其中,所述从所述数据文档中获取用于构建索引的信息的步骤包括:
根据预置的配置文件中的各索引字段以及用于构建索引的信息的结构信息从所述数据文档中获取用于构建索引的信息。
4.根据权利要求1至3中任一权利要求所述的方法,其中,所述数据文档和文档标识以键值方式存储于基于机械硬盘的服务器中的数据库中。
5.一种搜索的实现方法,其中,所述方法包括以下步骤:
从接收到的搜索请求中获取搜索关键词;
根据搜索引擎服务系统中构建的索引获取所述搜索关键词对应的索引;
根据所述搜索关键词对应的索引中的文档标识从数据存储服务系统中获取相应的数据文档;
根据所述获取的数据文档形成所述搜索请求的搜索结果;
其中,所述搜索引擎服务系统包括多台基于固态硬盘的服务器,所述数据存储服务系统包括多台基于机械硬盘的服务器;
所述根据所述搜索关键词对应的索引中的文档标识从数据存储服务系统中获取相应的数据文档的步骤包括:
对所述搜索关键词对应的各索引中的文档标识分别进行哈希运算;
根据各哈希运算的结果确定所述各索引中的文档标识各自对应的基于机械硬盘的服务器;
从所述各索引中的文档标识各自对应的基于机械硬盘的服务器中获取相应的数据文档。
6.根据权利要求5所述的方法,其中,所述根据搜索引擎服务系统中构建的索引获取所述搜索关键词对应的索引的步骤包括:
将所述搜索关键词发送给多台基于固态硬盘的服务器,并汇总多台基于固态硬盘的服务器分别根据其各自构建的索引而获取到的所述搜索关键词对应的索引;
从所述汇总的索引中选取出至少一个索引,并将选取出的索引作为所述搜索关键词对应的索引。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610151332.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种配套无人机的多功能交通指挥车
- 下一篇:一种货车车厢