[发明专利]一种医疗数据的采集方法在审

专利信息
申请号: 202111534928.4 申请日: 2021-12-15
公开(公告)号: CN114242256A 公开(公告)日: 2022-03-25
发明(设计)人: 杨东霖;孙党生;成国强 申请(专利权)人: 北京智康通达信息技术有限公司
主分类号: G16H50/70 分类号: G16H50/70;G06F16/22;G06F16/2458;G06F16/248
代理公司: 北京慧诚智道知识产权代理事务所(特殊普通合伙) 11539 代理人: 殷炳蕾
地址: 100043 北京市石景*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 医疗 数据 采集 方法
【说明书】:

发明实施例涉及一种医疗数据的采集方法,所述方法包括:获取待采集医疗数据库中各个医疗数据表的表内字段信息,生成对应的库信息集合;根据各个表信息集合以及所有医疗数据表的表间关联关系,构建实体‑联系图生成对应的数据表联系图;获取一组待采字段名;将与各个待采字段名同类别且字段名相似度最高的表内字段名作为对应的相似字段名;选择覆盖了全部相似字段名且长度最短的结点路径作为最优全字段结点路径;根据最优全字段结点路径构建对应的数据库查询指令;并将数据库查询指令在待采集医疗数据库中的执行结果,作为与本组待采字段名对应的医疗数据采集结果返回。通过本发明既可以提高数据预处理效率,又可以提高医疗数据查询效率。

技术领域

本发明涉及数据处理技术领域,特别涉及一种医疗数据的采集方法。

背景技术

各家医疗机构的医疗数据库中都保存了大量的医疗数据表,每个医疗数据表中包括多个表内字段,每个表内字段的定义方式以院方自定义为主,如此就导致了各家医疗机构的医疗数据库、医疗数据表乃至各个表内字段的定义都不是标准统一的,各个医疗数据表间的关联关系也不是标准统一的。

在这种情况下,当第三方数据采集机构(例如医疗保险机构)按其所需待采字段名在各家医疗机构的医疗数据库中进行医疗数据采集时,就需要各家医疗机构的工作人员或医疗数据库服务商按第三方数据采集机构的数据采集要求进行以下数据处理工作:首先建立各个待采字段名与自家表内字段名的匹配关系,其次根据匹配关系定位所需采集的医疗数据表,再根据定位的多个医疗数据表之间的关联关系组装数据库查询指令,再将数据库查询指令的数据库查询结果作为数据采集结果向第三方数据采集机构回发。

在进行上述数据处理工作的过程中,我们发现以下问题:1)工作人员或医疗数据库服务商在匹配待采字段名、定位医疗数据表时缺乏较为有效的数据比对与表单定位工具,导致查询前的数据预处理效率较低;2)有些采集数据可通过不同的医疗数据表关联组合获取,由此就可能导致因为采用了较为复杂的数据表关联组合进行查询,从而引发数据库整体查询效率降低的问题。

发明内容

本发明的目的,就是针对现有技术的缺陷,提供一种医疗数据的采集方法、电子设备及计算机可读存储介质,基于自然语言处理(Natural Language Processing,NLP)技术的文本相似度比较办法和知识图谱的实体-联系图(Entity Relationship Diagram)结构提供一种有效的数据比对与表单定位处理机制,借鉴知识图谱最短路径规划办法提供一种查询效率最高、占用资源最少的数据库查询指令获取机制。通过本发明在对接第三方数据采集机构的医疗数据采集操作时,既可以提高数据预处理效率,又可以提高医疗数据查询效率。

为实现上述目的,本发明实施例第一方面提供了一种医疗数据的采集方法,所述方法包括:

获取待采集医疗数据库中各个医疗数据表的表内字段信息,生成对应的库信息集合;所述库信息集合包括多个表信息集合;所述表信息集合包括多个表内字段信息;所述表内字段信息包括表内字段名和表内字段类别;所述表信息集合与所述医疗数据表一一对应;

根据各个所述医疗数据表的所述表信息集合以及所有所述医疗数据表的表间关联关系,构建实体-联系图生成对应的数据表联系图;所述数据表联系图包括多个数据表结点;所述数据表结点与所述医疗数据表一一对应;每个所述数据表结点具有一组结点信息与对应的所述表信息集合一致;

获取一组待采字段名;

将所述库信息集合中与各个所述待采字段名同类别且字段名相似度最高的所述表内字段名作为对应的相似字段名;

在所述数据表联系图中选择覆盖了全部所述相似字段名且长度最短的结点路径作为最优全字段结点路径;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京智康通达信息技术有限公司,未经北京智康通达信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111534928.4/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top