[发明专利]一种基于多中心临床数据防作弊分析的疾病预测系统有效
申请号: | 202210444327.2 | 申请日: | 2022-04-26 |
公开(公告)号: | CN114566289B | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 李冠男;李劲松;池胜强;王宇清;朱伟伟;田雨;周天舒 | 申请(专利权)人: | 之江实验室 |
主分类号: | G16H50/70 | 分类号: | G16H50/70;G16H50/50;G06K9/62;G06V10/762 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 刘静 |
地址: | 310023 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 中心 临床 数据 作弊 分析 疾病 预测 系统 | ||
本发明公开了一种基于多中心临床数据防作弊分析的疾病预测系统,本发明利用区块链技术共享伪数据,并让所有医疗机构在本地利用加权聚类模型根据伪数据计算数据质量系数,保证临床数据量少的医疗机构的真实临床数据能够被充分利用的同时还使得医疗机构无法对本地临床数据质量评价结果进行作弊。本发明设计的模型参数投票迭代机制,每轮迭代中根据投票结果保留一家医疗机构提供的模型参数,可以使得质量好的临床数据在模型训练中发挥更大作用。本发明设计的投票权的初始化和更新机制,以及在迭代投票过程中的作弊检测机制,让临床数据质量好的医疗机构拥有更多投票权,也防止了单家或多家医疗机构勾结篡改投票结果。
技术领域
本发明属于医疗健康信息技术领域,具体涉及一种基于多中心临床数据防作弊分析的疾病预测系统。
背景技术
不同医疗机构由于其所在区域、治疗水平、医保报销、收费标准等因素的差别,在疾病数量分布上存在着较大的差异。单家医疗机构的临床数据不足以支撑一个高准确性的疾病预测模型构建。为了训练一个效果较好的疾病预测模型,往往需要大量高质量的临床数据。多中心临床数据的协同分析为大规模临床数据的整合分析利用提供了解决方案。但是,在数据安全和隐私保护的约束下,各家医疗机构的原始临床数据不能直接离开机构,导致多中心临床数据分析过程存在许多难点。
在多中心临床数据分析与建模的过程中,不仅需要保证临床数据不被窃取,还要保证参与协同分析建模的医疗机构无法单独或相互勾结后进行篡改疾病预测模型的模型参数、篡改疾病预测模型评价结果、泄露模型参数、提供噪声数据干扰模型训练、不提供真实临床数据或恶意提供低质量临床数据来获取最终模型参数等作弊行为。需要一种多中心临床数据防作弊分析方法,在保证临床数据安全性和防止医疗机构作弊的前提下,利用多家医疗机构的临床数据共同训练一个准确性高、泛化性好的疾病预测模型。现有的常见解决方案主要有:(1)联邦学习:由多家医疗机构和一个可信的中心服务器组成。医疗机构在本地利用临床数据训练预测模型,模型参数经过同态加密后发送给中心服务器。中心服务器利用同态加密的加法同态性和乘法同态性直接对模型参数的密文进行聚合处理,并将处理结果分发回医疗机构。医疗机构对聚合后的模型参数的密文进行解密后进行下一轮迭代,直至预测模型收敛。(2)群体智能:利用区块链,提供一种去中心化的协同分析建模方法。由医疗机构构成一个群网络,每家医疗机构在本地利用临床数据训练预测模型后通过区块链交换模型参数。模型参数在医疗机构本地进行模型聚合后进行下一轮迭代。
常见解决方案具有以下不足:联邦学习需要有一个中心服务器进行模型参数聚合等操作,医疗机构与中心服务器的地位不平等。不可信的中心服务器与医疗机构串通后会存在模型参数篡改、模型参数泄露等风险,甚至基于模型参数推断出原始临床数据。群体智能可以让医疗机构利用区块链传递模型参数,模型参数传递到单个医疗机构,与该机构本地训练的模型参数合并以后发送到下一家医疗机构。若存在不可信的医疗机构,则模型参数会存在泄露和被篡改的风险。
此外,联邦学习和群体智能在协同分析建模的过程中,各个医疗机构的临床数据具有相同的重要性。然而实际上部分医疗机构的临床数据质量较差,协同分析建模的过程中会对疾病预测模型的效果造成影响。
中国发明专利 CN114048515A公开了一种基于联邦学习和区块链的医疗大数据共享方法,利用传统的联邦学习框架进行协同分析建模,将训练过程中医疗机构每轮训练用时和准确率结果保存到区块链上。完成协同分析建模后,中心服务器根据每家医疗机构提供的算力、每轮训练用时、提供的临床数据量、提供的临床数据质量来分配奖励,如模型使用权限等。然而,每家医疗机构提供的算力、每轮训练用时、提供的临床数据量、提供的临床数据质量都是由医疗机构自己提供的,缺少验证其真实性的方法,存在着作弊的风险。例如,该方法中验证医疗机构临床数据质量的方法是根据本地模型的准确率计算得到,不可信的医疗机构可通过上传虚假的准确率来获得更多的奖励,如更高的模型使用权限等。
发明内容
针对现有技术的不足,本发明提供一种基于多中心临床数据防作弊分析的疾病预测系统。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210444327.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种装配式混凝土墙板钢结构连接装置
- 下一篇:一种管口扩口和缩口一体机
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置