[发明专利]一种基于因果关系挖掘的临床数据自动化生成方法及系统有效

专利信息
申请号: 202210782447.3 申请日: 2022-07-05
公开(公告)号: CN114864099B 公开(公告)日: 2022-11-01
发明(设计)人: 李劲松;路子豪;田雨;周天舒 申请(专利权)人: 浙江大学
主分类号: G16H50/70 分类号: G16H50/70;G16H10/60;G06N3/04;G06N3/08
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 刘静
地址: 310058 浙江*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 因果关系 挖掘 临床 数据 自动化 生成 方法 系统
【说明书】:

发明公开了一种基于因果关系挖掘的临床数据自动化生成方法及系统,从医学数据的收集来源出发,按照患者的入院出院流程,将患者留存在医院的信息进行分门别类的统计,忽略患者入院流程中产生的多余信息,将患者的入院流程整理为病情、检查、病症、药物4项,将其整合为统一数据集,之后再根据使用者的个性化需求,对数据集中的数据进行第一次筛选,之后通过算法明确各列数据间的依赖关系和依赖方向,绘出挑选的数据的完全部分有向无环图,从而发现这些数据之间的因果关联,之后再从因果图中挑选出使用者感兴趣的部分进行因果关联虚拟生成,进而解决生成的虚拟数据之间联系不紧密的问题。

技术领域

本发明涉及医疗信息技术领域,尤其涉及一种基于因果关系挖掘的临床数据自动化生成方法及系统。

背景技术

通过对个体患者临床数据的整合、分析与挖掘,可以为个体患者建立一个良好的健康模型,给患者提供一个精细、准确的疾病预防方案和治疗方案。个体患者的临床数据一旦被整合收集,由机构统一研究,就可以辅助开发医疗软件,开发新药等等,这会对医疗行业有很大的辅助作用,但是这些临床数据往往包含着患者敏感的个人信息,这些隐私信息一旦泄露就有可能给患者的生活带来一定的负面影响,所以医疗部门在使用这些数据时会有担忧。

为了让医学临床数据充分发挥作用,就要解决医学临床数据中隐私性带来的问题,一方面可以通过各种匿名化手段来隐去个人可辨识信息,但是攻击者可以通过手中的其他信息表进行撞库,从而获取到发布的信息表中的个人可辨识信息,这种方式并不稳定,会受到数据攻击者持有数据的威胁,并不能有效保护患者的隐私数据。另一方面也可以生成整体的虚拟的医学临床数据来隔离开单独的真实的隐私数据,只要保证虚拟数据和真实数据在整体分布上相似,就不用担心真实数据中的隐私泄露问题了,但是患者产生的临床数据种类多、样式多,难以完整地对所有数据进行虚拟生成,并且生成的虚拟数据与真实数据的相似度无法完美保证,虚拟数据对真实临床数据之间的关联情况的学习并不充分,还没有达到实际应用的目标。

现有技术产生的虚拟患者的合理性不足,虚拟患者的数据有前后矛盾的可能。现有技术在生成多种临床数据时大多是将这些临床数据通过数据拼接的方式连接到一起,然后通过生成对抗网络互相竞争自我学习的方式来隐性获取数据之间的关联,这种方式学习不到数据关联的真实情况,并且学习到的关联会存有一定误差,导致生成的虚拟数据有可能出现前后冲突的情况。在医学领域,采用生成虚拟数据的方式来保护患者隐私的方法有很多,但基本的思路是不变的,都是一份数据、一份数据的生成,先掌握分布,然后根据真实数据的分布情况来生成虚拟数据。但是由于神经网络的黑箱特性,无法对生成的虚拟数据进行适当的解释,而医学领域相比于其他的工业和机械领域更加强调结果来源的可解释性,这就导致该模型的适用性较低,不具有普遍使用的价值。

已经有许多研究针对临床数据的隐私性提出了自己的解决方案,其中与本发明最相近似的技术方案则是2018年Baowaly等人提出的medWGAN和medBGAN,这两种方案都是在2017年Choi等人提出的medGAN的基础上进行优化得到的,接下来将对该方案进行详细描述。

medGAN对医学数据中较为重要的两种数据——疾病数据和手术数据进行虚拟生成,该方案以MIMIC_III数据集作为实例验证,借助国际疾病分类(internationalClassification of diseases , ICD)依据疾病的某些特征将疾病分门别类,通过舍尾的方式对MIMIC_III数据集中的疾病数据和手术数据进行简单收集,在去掉大量细小分类项之后,对其采用one-hot编码方式,借助自动编码器的学习能力,将离散数据转变为连续数据,然后将最初的生成对抗网络中的卷积层更改为全连接层,进而对原始临床数据的分布进行建模,通过生成器来获取与真实医学数据相似的虚拟临床数据。

相比于medGAN,medWGAN和medBGAN最重要的改进则是将生成对抗网络中较优秀的模型替代掉medGAN中最初的生成对抗网络,加快了训练速度、适当地改善了生成对抗网络训练过程中出现的模式崩溃问题。

参考文献

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210782447.3/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top