[发明专利]一种基于大数据技术的临床科研专病库构建方法在审

专利信息
申请号: 202110346760.8 申请日: 2021-03-31
公开(公告)号: CN113111048A 公开(公告)日: 2021-07-13
发明(设计)人: 黄晓琴;戴静娟;谢建斌;陈名扬;王永迪;张恒瑞 申请(专利权)人: 宁波金唐软件有限公司
主分类号: G06F16/21 分类号: G06F16/21;G06F16/2458;G06F16/25;G06F16/28;G16H10/20
代理公司: 宁波甬致专利代理有限公司 33228 代理人: 李迎春
地址: 315000 浙江省宁*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 数据 技术 临床 科研 专病库 构建 方法
【权利要求书】:

1.一种基于大数据技术的临床科研专病库构建方法,其特征在于,包括下列步骤:

S1、从数据源层中抽取结构化数据和非结构化数据,所述数据源层包含医院各个业务系统医疗数据,所述结构化数据和非结构化数据均包含患者的基础信息与该患者的专病特征信息;

S2、根据不同专病的类型构建与专病类型一一对应的专病库,然后对数据源层中抽取的所述结构化数据和非结构化数据分别进行数据处理,所述处理后的结构化数据与非结构数据均包含若干个数据对,每个数据对的存在形式为:患者的基础信息-该患者的专病特征信息;

S3、完成数据处理后,根据各个数据对的患者的专病特征信息,将各个数据对分别导入到与所述患者的专病特征信息对应的专病库中。

2.根据权利要求1所述的一种基于大数据技术的临床科研专病库构建方法,其特征在于,所述结构化数据的抽取、数据处理以及导入专病库的具体步骤为:

A1、构建专门用于存储结构化数据的数据中心CDR;

A2、使用全量导入的方式将数据源层中的结构化数据同步到数据中心CDR中,完成数据中心CDR的数据初始导入;

A3、定期使用增量导入的方式,将数据源层中新增的结构化数据同步到数据中心CDR中;

A4、完成将结构化数据汇总到数据中心CDR中后,根据已构建的专病库种类,在数据中心CDR中将结构化数据处理为若干个患者的基础信息-该患者的专病特征信息数据对,然后将数据对分别归入对应的专病种类,并导入到与专病种类对应的专病库中。

3.根据权利要求1所述的一种基于大数据技术的临床科研专病库构建方法,其特征在于,所述非结构化数据的抽取、数据处理以及导入专病库的具体步骤为:

B1、采用全量导入的方式,将数据源层中的非结构化数据导入到专病库中。

B2、定期使用增量导入的方式,从数据源层中抽取更新的非结构化数据导入到专病库中。

4.根据权利要求3所述的一种基于大数据技术的临床科研专病库构建方法,其特征在于,所述步骤B1中的非结构化数据导入到专病库中具体步骤为:

B11、从数据源层中抽取所有非结构化数据,使用自然语言处理技术对所述非结构化数据进行文本挖掘,获取到若干个患者的基础信息以及对应患者的专病特征信息;

B12、将步骤B11得到的若干个患者的基础信息以及对应患者的专病特征信息转化为结构化数据,所述结构化数据包含若干个数据对,每个数据对的存在形式为:患者的基础信息-该患者的专病特征信息,根据数据对中的患者的专病特征信息,将数据对归入对应的专病种类,并导入对应的专病库。

5.根据权利要求3所述的一种基于大数据技术的临床科研专病库构建方法,其特征在于,所述步骤B2中的非结构化数据导入到专病库中具体包括下列步骤:

B21、从数据源层中抽取更新的非结构化数据,使用自然语言处理技术对所述非结构化数据进行文本挖掘,获取到若干个患者的基础信息以及对应患者的专病特征信息;

B22、将步骤B21得到的患者的基础信息与该患者的专病特征信息转化为结构化数据的形式,所述结构化数据包含若干个数据对,每个数据对的存在形式为:患者的基础信息-该患者的专病特征信息,根据数据对中的患者的专病特征信息,将数据对归入对应的专病种类,并导入对应的专病库。

6.根据权利要求4或权利要求5所述的一种基于大数据技术的临床科研专病库构建方法,其特征在于,自然语言处理技术对所述非结构化数据进行文本挖掘具体包括下列步骤:

C1、根据是否具有结构化数据特征,将所述非结构化数据分为半非结构化数据和全非结构化数据,若具有结构化数据特征,则为半非结构化数据,若不具有结构化数据特征,则为全非结构化数据;

C2、设置一针对半非结构化数据的半非结构化数据自然语言处理模块,对半非结构化数据进行文本挖掘;

C3、设置一针对全非结构化数据的全非结构化数据自然语言处理模块,对全非结构化数据进行文本挖掘。

7.根据权利要求1所述的一种基于大数据技术的临床科研专病库构建方法,其特征在于,步骤S2中根据不同专病的类型构建一一对应的专病库的具体步骤为:

D1、各个专病科室,根据专病的不同科研粒度对自己科室下的专病类型进行划分,得到多个专病库;

D2、各个专病科室对自己科室下的多个专病库,根据专病特征分别设计专病表格,所述专病表格用于存储最终导入到专病库中的结构化数据;

D3、各个专病科室针对自己科室下的各个专病表格,在专病表格中设计用于将结构化数据与专病表格关联的关键字段,最终得到用于指导结构化数据归类以及导入到对应专病库的专病表格。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波金唐软件有限公司,未经宁波金唐软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110346760.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top