[发明专利]一种基于多中心临床数据防作弊分析的疾病预测系统有效

专利信息
申请号: 202210444327.2 申请日: 2022-04-26
公开(公告)号: CN114566289B 公开(公告)日: 2022-08-09
发明(设计)人: 李冠男;李劲松;池胜强;王宇清;朱伟伟;田雨;周天舒 申请(专利权)人: 之江实验室
主分类号: G16H50/70 分类号: G16H50/70;G16H50/50;G06K9/62;G06V10/762
代理公司: 杭州求是专利事务所有限公司 33200 代理人: 刘静
地址: 310023 浙江省杭州市余*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 中心 临床 数据 作弊 分析 疾病 预测 系统
【说明书】:

本发明公开了一种基于多中心临床数据防作弊分析的疾病预测系统,本发明利用区块链技术共享伪数据,并让所有医疗机构在本地利用加权聚类模型根据伪数据计算数据质量系数,保证临床数据量少的医疗机构的真实临床数据能够被充分利用的同时还使得医疗机构无法对本地临床数据质量评价结果进行作弊。本发明设计的模型参数投票迭代机制,每轮迭代中根据投票结果保留一家医疗机构提供的模型参数,可以使得质量好的临床数据在模型训练中发挥更大作用。本发明设计的投票权的初始化和更新机制,以及在迭代投票过程中的作弊检测机制,让临床数据质量好的医疗机构拥有更多投票权,也防止了单家或多家医疗机构勾结篡改投票结果。

技术领域

本发明属于医疗健康信息技术领域,具体涉及一种基于多中心临床数据防作弊分析的疾病预测系统。

背景技术

不同医疗机构由于其所在区域、治疗水平、医保报销、收费标准等因素的差别,在疾病数量分布上存在着较大的差异。单家医疗机构的临床数据不足以支撑一个高准确性的疾病预测模型构建。为了训练一个效果较好的疾病预测模型,往往需要大量高质量的临床数据。多中心临床数据的协同分析为大规模临床数据的整合分析利用提供了解决方案。但是,在数据安全和隐私保护的约束下,各家医疗机构的原始临床数据不能直接离开机构,导致多中心临床数据分析过程存在许多难点。

在多中心临床数据分析与建模的过程中,不仅需要保证临床数据不被窃取,还要保证参与协同分析建模的医疗机构无法单独或相互勾结后进行篡改疾病预测模型的模型参数、篡改疾病预测模型评价结果、泄露模型参数、提供噪声数据干扰模型训练、不提供真实临床数据或恶意提供低质量临床数据来获取最终模型参数等作弊行为。需要一种多中心临床数据防作弊分析方法,在保证临床数据安全性和防止医疗机构作弊的前提下,利用多家医疗机构的临床数据共同训练一个准确性高、泛化性好的疾病预测模型。现有的常见解决方案主要有:(1)联邦学习:由多家医疗机构和一个可信的中心服务器组成。医疗机构在本地利用临床数据训练预测模型,模型参数经过同态加密后发送给中心服务器。中心服务器利用同态加密的加法同态性和乘法同态性直接对模型参数的密文进行聚合处理,并将处理结果分发回医疗机构。医疗机构对聚合后的模型参数的密文进行解密后进行下一轮迭代,直至预测模型收敛。(2)群体智能:利用区块链,提供一种去中心化的协同分析建模方法。由医疗机构构成一个群网络,每家医疗机构在本地利用临床数据训练预测模型后通过区块链交换模型参数。模型参数在医疗机构本地进行模型聚合后进行下一轮迭代。

常见解决方案具有以下不足:联邦学习需要有一个中心服务器进行模型参数聚合等操作,医疗机构与中心服务器的地位不平等。不可信的中心服务器与医疗机构串通后会存在模型参数篡改、模型参数泄露等风险,甚至基于模型参数推断出原始临床数据。群体智能可以让医疗机构利用区块链传递模型参数,模型参数传递到单个医疗机构,与该机构本地训练的模型参数合并以后发送到下一家医疗机构。若存在不可信的医疗机构,则模型参数会存在泄露和被篡改的风险。

此外,联邦学习和群体智能在协同分析建模的过程中,各个医疗机构的临床数据具有相同的重要性。然而实际上部分医疗机构的临床数据质量较差,协同分析建模的过程中会对疾病预测模型的效果造成影响。

中国发明专利 CN114048515A公开了一种基于联邦学习和区块链的医疗大数据共享方法,利用传统的联邦学习框架进行协同分析建模,将训练过程中医疗机构每轮训练用时和准确率结果保存到区块链上。完成协同分析建模后,中心服务器根据每家医疗机构提供的算力、每轮训练用时、提供的临床数据量、提供的临床数据质量来分配奖励,如模型使用权限等。然而,每家医疗机构提供的算力、每轮训练用时、提供的临床数据量、提供的临床数据质量都是由医疗机构自己提供的,缺少验证其真实性的方法,存在着作弊的风险。例如,该方法中验证医疗机构临床数据质量的方法是根据本地模型的准确率计算得到,不可信的医疗机构可通过上传虚假的准确率来获得更多的奖励,如更高的模型使用权限等。

发明内容

针对现有技术的不足,本发明提供一种基于多中心临床数据防作弊分析的疾病预测系统。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210444327.2/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top