[发明专利]一种数据检索方法和装置有效
申请号: | 201910527961.0 | 申请日: | 2019-06-18 |
公开(公告)号: | CN110413724B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 胡德鹏;张远斌 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/33;G06F16/36 |
代理公司: | 北京连和连知识产权代理有限公司 11278 | 代理人: | 张涛 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 检索 方法 装置 | ||
本发明公开了一种数据检索方法与装置,包括:将检索引擎中的映射表和高频文档同步到非易失性内存储器,响应于接收到不同检索条件,通过映射表在易失性内存储器中执行反向索引,以获得不同被检索文档,根据不同被检索文档的各自的被检索频率重新确定高频文档,获取新增索引文档并写入非易失性内存储器,并在非易失性内存储器中根据新增索引文档更新映射表,将重新确定的高频文档、新增索引文档、和更新的映射表反馈到检索引擎。本发明的技术方案能够以更快的速度检索非结构化数据,一次性载入数据并提高检索引擎读取数据的速度,降低检索引擎的响应时间,提高工作效率。
技术领域
本发明涉及数据库领域,并且更具体地,特别是涉及一种数据检索方法与装置。
背景技术
由于互联网物联网应用的发展,检索海量数据成为技术发展的挑战。传统的关系型数据库只能满足关系型数据的检索需要,而当前非结构化数据的增长已经超出了结构化关系型数据。为解决海量非结构化数据的全文检索需求,高效快速的全文检索引擎技术成为当前的技术热点。
现有技术的全文检索引擎能够收集数据建立索引库,将现实中的结构化数据和非结构化数据进行提取信息创建索引。索引是为字符串到文件的映射,建立索引可以大大提高检索效率。问题在于,全文检索引擎将索引库、类型表、文档、映射表等等信息存储在磁盘中,磁盘读写性能限制了读取数据的速率;同时由于数据量大,读取的数据需要切分为多个分段文件,在进入内存时无法一次全部读入内存。这两个问题都会延长全文检索引擎的响应时间。
针对现有技术中检索引擎读取数据的速度慢、加载数据分段的问题,目前尚未有有效的解决方案。
发明内容
有鉴于此,本发明实施例的目的在于提出一种数据检索方法与装置,能够以更快的速度检索非结构化数据,一次性载入数据并提高检索引擎读取数据的速度,降低检索引擎的响应时间,提高工作效率。
基于上述目的,本发明实施例的一方面提供了一种数据检索方法,包括周期性地执行以下步骤:
将检索引擎中的映射表和高频文档同步到非易失性内存储器;
响应于接收到不同检索条件,通过映射表在易失性内存储器中执行反向索引,以获得不同被检索文档;
根据不同被检索文档的各自的被检索频率重新确定高频文档;
获取新增索引文档并写入非易失性内存储器,并在非易失性内存储器中根据新增索引文档更新映射表;
将重新确定的高频文档、新增索引文档、和更新的映射表反馈到检索引擎。
在一些实施方式中,检索引擎配置为包括用于连接到非易失性内存储器的非易失性内存储器接口;
将检索引擎中的映射表和高频文档同步到非易失性内存储器包括:将检索引擎中的映射表和高频文档通过非易失性内存储器接口同步到非易失性内存储器。
在一些实施方式中,将重新确定的高频文档、新增索引文档、和更新的映射表反馈到检索引擎包括:将重新确定的高频文档的文档标识、新增索引文档的文档数据、和更新的映射表的表数据通过非易失性内存储器接口发送到检索引擎。
在一些实施方式中,接收到不同检索条件包括接收到一个或多个不同检索字符串;
响应于接收到不同检索条件,通过映射表在易失性内存储器中执行反向索引,以获得不同被检索文档,包括针对一个或多个不同检索字符串分别执行以下步骤:
根据一个或多个不同检索字符串分别从非易失性内存储器中存储的映射表中提取对应的文档链表;
当一个或多个不同检索字符串为多个不同检索字符串时,还将多个不同检索字符串各自对应的文档链表根据不同检索条件合并为总链表;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910527961.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置