[发明专利]一种文档数据库检索方法与装置在审
申请号: | 202110612886.5 | 申请日: | 2021-06-02 |
公开(公告)号: | CN113284573A | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 杨高超;孙承旭;欧阳义 | 申请(专利权)人: | 山东健康医疗大数据有限公司 |
主分类号: | G16H10/60 | 分类号: | G16H10/60;G06F16/22;G06F16/2453;G06F16/2458;G06F16/27 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 郗艳荣 |
地址: | 250117 山东省济南市槐*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文档 数据库 检索 方法 装置 | ||
本发明特别涉及一种文档数据库检索方法与装置。该文档数据库检索方法与装置,基于桶存储模式构建数据存储模块,通过对数据的有效组织,以桶的方式将数据存储到特定维度的文档中;将基于文档数据库的桶查询模式应用于数据模型,加快大批量数据查询效率,节省索引大小,简化潜在的查询,提高索引性能;该文档数据库检索方法与装置,将基于文档数据库的桶查询模式应用于数据模型,加快了大批量数据查询效率,节省了索引大小,提高了检索效率和响应速度。
技术领域
本发明涉及大数据检索技术领域,特别涉及一种文档数据库检索方法与装置。
背景技术
随着现代测量技术和智能设备的发展,数据的形式由传统单一的结构化数据形式逐步演变为结构化数据、半结构化数据和非结构化数据组成的复杂数据形式。以用户就医产生的数据为例,用户分散无组织且规模庞大,我们不仅仅对数据进行宏观指标分析,更加关注微观的数据间的关联分析,实现多维度的数据管理、存储和分析挖掘。
针对海量医疗数据管理分析辅助临床决策,对数据处理的实时性、准确性提出的更高的要求,本发明提出了一种文档数据库检索方法与装置。
发明内容
本发明为了弥补现有技术的缺陷,提供了一种简单高效的文档数据库检索方法与装置。
本发明是通过如下技术方案实现的:
一种文档数据库检索方法,其特征在于:包括以下步骤:
第一步,基于桶存储模式构建数据存储模块,通过对数据的有效组织,以桶的方式将数据存储到特定维度的文档中;
第二步,将基于文档数据库的桶查询模式应用于数据模型,加快大批量数据查询效率,节省索引大小,简化潜在的查询,提高索引性能。
所述第一步中,利用文档数据模型,根据用户身份信息将用户就医数据以桶的方式储存到特定的文档中。
所述第一步中,通过编程方式向每一个桶中添加自定义的附加信息。
数据分类、聚类等技术能够较有效的解决数据杂乱的现象。将源数据重新处理,通过自动分类聚类等方法进行重新组织划分存入非关系型数据库中。所述预聚合就是根据不同的维度将数据聚合在一起,根据不同的需求对应的业务场景从非关系型数据库中读取对应维度的数据。
所述第一步中,在数据库中,以用户身份信息为维度,将用户就医数据预聚合在一起并存入一个文档内;检索用户就医数据时,直接访问用户的预聚合数据即可,既减少了计算量,又能提升响应速度。
所述用户就医数据包括用户门诊数据,用户住院数据和用户体检数据。
所述第一步中,以用户的唯一标识(身份证号或就诊卡号)为主键建立索引,将各用户的预聚合数据存入MongoDB数据库。
所述第二步中,利用MongoDB数据库提供的内嵌式数组或子文档特性,同时以用户的唯一标识(身份证号)进行主键索引,即可获得用户就医数据。
该文档数据库检索装置,包括数据存储模块和数据查询模块;
所述数据存储模块采用桶存储模式,以用户身份信息为维度,将用户就医数据预聚合在一起并存入一个文档内;
所述数据查询模块根据用户唯一标识进行主键索引,即可获取对应用户的用户门诊数据,用户住院数据和用户体检数据。
本发明的有益效果是:该文档数据库检索方法与装置,将基于文档数据库的桶查询模式应用于数据模型,加快了大批量数据查询效率,节省了索引大小,提高了检索效率和响应速度。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东健康医疗大数据有限公司,未经山东健康医疗大数据有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110612886.5/2.html,转载请声明来源钻瓜专利网。