[发明专利]心脑血管患者相似性分析方法及系统在审
申请号: | 201710057343.5 | 申请日: | 2017-01-26 |
公开(公告)号: | CN106778042A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 童晓渝;章玉宇;崔修涛;王永明;熊伟;胡天龙;廖光源 | 申请(专利权)人: | 中电科软件信息服务有限公司 |
主分类号: | G06F19/00 | 分类号: | G06F19/00;G06K9/62 |
代理公司: | 上海汉声知识产权代理有限公司31236 | 代理人: | 郭国中 |
地址: | 200233 上海市嘉定区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 脑血管 患者 相似性 分析 方法 系统 | ||
技术领域
本发明涉及一种智慧医疗领域,具体地,涉及一种心脑血管患者相似性分析方法及系统。
背景技术
随着社会的发展,心脑血管疾病的发病率逐年上升。在我国,心脑血管疾病已成为当今严重危害中老年人生命与健康的主要公共卫生问题,其发病率、病死率、致残率较高。根据统计,中国每年发生脑中风病人达200万,致残率高达75%,约3/4的患者有不同程度劳动丧失,生活需要照顾,给患者、家庭、社会带来沉重的负担。
随着康复医学在我国得到迅速发展,心脑血管患者的病死率显著降低,但致残率仍非常高。今后临床治疗模式将越来越呈现个性化、精确化,精准康复将是今后康复医学发展方向。目前的康复治疗没有从临床的角度根据病因、生理体征、生活习惯、生活环境等影响因子对患者群体进行基于相似性的有效分组,因此也就无法对患者进行个性化的康复治疗,大大影响了患者的康复效果和满意度。
随着医疗信息化的发展,医院也积累了大量的数据。如何更好的利用数据以及医学知识,通过认知计算技术,提供精准医疗的决策是心脑血管疾病临床治疗阶段所需要的。本发明的主要目标就是基于历史数据将脑卒中康复患者细化分群,为特定患者找到患情最相似的一群其他患者,从而基于相似患者的诊疗实践提取和挖据诊疗证据,为目标个体患者的个性化的康复治疗项目。
到目前为止,基于认知计算技术的中国人群心脑血管疾病相似性分析方面尚属空白。而国内外认知计算技术在心脑血管疾病中的应用主要集中在发病风险预测及诊断方面,在心脑血管患者相似性分析方面还尚未见有报道。鉴于国内外没有可用于心脑血管患者相似性分析的智能模型,很有必要建立一种面向临床医生的心脑血管患者相似性分析模型。
发明内容
针对现有技术中的缺陷,本发明的目的是提供一种心脑血管患者相似性分析方法及系统,其建立有效地心脑血管患者相似性分析模型,临床医生通过患者特征就能得到给定患者的相似人群,然后推荐个性化治疗方案,以达到精准医疗的目的,能够很好的对中国人群心脑血管疾病患者进行基于相似性分析的人群分组,尽早针对不同的风险人群进行有针对性的个性化康复治疗,具有巨大的医疗和临床使用价值。
根据本发明的一个方面,提供一种心脑血管患者相似性分析方法,其特征在于,其包括以下步骤:
步骤一,问题定义,基于历史数据对心脑血管患者进行细化分群,研究特定治疗手段对特定人群治疗结局的影响,并针对个体患者推荐个性化治疗方案,将帮助临床医生更精准地认识目标患者的病情以及治疗手段所带来的预后效果,从而有效地实现个性化精准医疗;
步骤二,数据采集,针对目标人群,从相关信息系统收集观察期窗口内的患者医疗健康数据及预后结局数据,所采集的数据包括:康复科门诊数据、康复科治疗室数据、神内/神外门诊数据、神内/神外住院数据、康复科住院数据、脑卒中筛查门诊数据,这些数据涉及的内容涵盖有患者基本信息、病历或电子病历、检测检验、影像、诊断、处方、治疗、评估表数据;
步骤三,数据预处理,所采集的数据类型多种多样,包括:选择项、日期时间、数值型、字符型以及是否型数据,针对不同数据类型需要采取不同处理方法进行针对性数据预处理;
步骤四,特征工程,患者数据来自多个临床数据库,涉及患者个体生理信息、历史诊疗信息、病情信息,在使用机器学习技术建模学习数据之前,首先需要使用特定领域知识以及统计学习方法来提取或组合变化得到的各属性数据,从而生成有效的特征数据;
步骤五,基于相似性的患者聚类建模,采用基于划分的聚类算法、k-均值算法进行患者的聚类建模,其中通过夹角余弦来度量患者之间的相似性;
步骤六,诊疗方案推荐,当患者问诊时,结合问诊患者的个体特征和病患群体特征,采用基于相似性计算的群组定向技术,为问诊患者找到最相近历史病患群组,抽取出该群组内病患的主体诊疗方案作为首选诊疗方案推荐给问诊患者。
优选地,所述步骤三具体包括以下步骤:
步骤三十一,数据集成,把不同来源的数据按照一定规则整合到一起,根据病人ID号把不同数据源但是有同样ID号的信息连接在一起,这样所有不同数据源的数据就整合到了一起;
步骤三十二,数据清洗,针对不同数据类型存在的不同问题,提出了基于规则的数据清洗方法;
步骤三十三,缺失值处理,医疗领域的特征数据普遍在时间序列上比较稀疏,因此采用基于正则化最大期望算法进行缺失数据的填补,将缺失特征变量视为无法观测的隐藏变量,此方法一般分为三步:一,计算最大期望;二,正则化EM,避免过度拟合;三,对上一步生成的方程进行评估;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电科软件信息服务有限公司,未经中电科软件信息服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710057343.5/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用