[发明专利]心脑血管患者相似性分析方法及系统在审
| 申请号: | 201710057343.5 | 申请日: | 2017-01-26 |
| 公开(公告)号: | CN106778042A | 公开(公告)日: | 2017-05-31 |
| 发明(设计)人: | 童晓渝;章玉宇;崔修涛;王永明;熊伟;胡天龙;廖光源 | 申请(专利权)人: | 中电科软件信息服务有限公司 |
| 主分类号: | G06F19/00 | 分类号: | G06F19/00;G06K9/62 |
| 代理公司: | 上海汉声知识产权代理有限公司31236 | 代理人: | 郭国中 |
| 地址: | 200233 上海市嘉定区*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 脑血管 患者 相似性 分析 方法 系统 | ||
1.一种心脑血管患者相似性分析方法,其特征在于,其包括以下步骤:
步骤一,问题定义,基于历史数据对心脑血管患者进行细化分群,研究特定治疗手段对特定人群治疗结局的影响,并针对个体患者推荐个性化治疗方案,将帮助临床医生更精准地认识目标患者的病情以及治疗手段所带来的预后效果,从而有效地实现个性化精准医疗;
步骤二,数据采集,针对目标人群,从相关信息系统收集观察期窗口内的患者医疗健康数据及预后结局数据,所采集的数据包括:康复科门诊数据、康复科治疗室数据、神内/神外门诊数据、神内/神外住院数据、康复科住院数据、脑卒中筛查门诊数据,这些数据涉及的内容涵盖有患者基本信息、病历或电子病历、检测检验、影像、诊断、处方、治疗、评估表数据;
步骤三,数据预处理,所采集的数据类型多种多样,包括:选择项、日期时间、数值型、字符型以及是否型数据,针对不同数据类型需要采取不同处理方法进行针对性数据预处理;
步骤四,特征工程,患者数据来自多个临床数据库,涉及患者个体生理信息、历史诊疗信息、病情信息,在使用机器学习技术建模学习数据之前,首先需要使用特定领域知识以及统计学习方法来提取或组合变化得到的各属性数据,从而生成有效的特征数据;
步骤五,基于相似性的患者聚类建模,采用基于划分的聚类算法,即k-均值算法进行患者的聚类建模,其中通过夹角余弦来度量患者之间的相似性;
步骤六,诊疗方案推荐,当患者问诊时,结合问诊患者的个体特征和病患群体特征,采用基于相似性计算的群组定向技术,为问诊患者找到最相近历史病患群组,抽取出该群组内病患的主体诊疗方案作为首选诊疗方案推荐给问诊患者。
2.根据权利要求1所述的心脑血管患者相似性分析方法,其特征在于,所述步骤三具体包括以下步骤:
步骤三十一,数据集成,把不同来源的数据按照一定规则整合到一起,根据病人ID号把不同数据源但是有同样ID号的信息连接在一起,这样所有不同数据源的数据就整合到了一起;
步骤三十二,数据清洗,针对不同数据类型存在的不同问题,提出了基于规则的数据清洗方法;
步骤三十三,缺失值处理,医疗领域的特征数据普遍在时间序列上比较稀疏,因此采用基于正则化最大期望算法进行缺失数据的填补,将缺失特征变量视为无法观测的隐藏变量,此方法一般分为三步:一,计算最大期望;二,正则化EM,避免过度拟合;三,对上一步生成的方程进行评估;
步骤三十四,特征删除,根据专家知识对那些无效值和缺失值超过总样本量30%的,对于诊断问题不是特别重要的特征进行删除处理;
步骤三十五,去异常点,采用偏差分析、基于分布不合理性的异常检测方法,结合常识性规则、业务特定规则进行异常值的识别,并对异常点进行删除处理。
3.根据权利要求1所述的心脑血管患者相似性分析方法,其特征在于,所述步骤四具体包括以下步骤:
步骤四十一,特征构造和特征选择,其基于预处理后的数据,通过特征构造和特征选择技术识别潜在的风险因子;
步骤四十二,特征处理,使用log映射函数将特征取值映射到[0,1]区间,同时采用等值划分方法对连续数据的离散化处理,将特征空间按照值域进行均分,每一段内的取值等同处理。
4.一种心脑血管患者相似性分析系统,其特征在于,其包括:
问题定义模块,基于历史数据对心脑血管患者进行细化分群,研究特定治疗手段对特定人群治疗结局的影响,并针对个体患者推荐个性化治疗方案;
数据采集模块,从相关信息系统收集观察期窗口内的患者医疗健康数据及预后结局数据;
数据预处理模块,针对不同数据类型需要采取不同处理方法进行针对性数据预处理;
特征工程生成模块,生成有效的特征数据;
患者聚类建模模块,采用基于划分的聚类算法,即k-均值算法进行患者的聚类建模;
诊疗方案推荐模块,采用基于相似性计算的群组定向技术,为问诊患者找到最相近历史病患群组,抽取出该群组内病患的主体诊疗方案作为首选诊疗方案推荐给问诊患者;
数据库,存储数据采集模块采集的数据以及诊疗方案推荐模块的治疗方案。
5.根据权利要求4所述的心脑血管患者相似性分析系统,其特征在于,所述问题定义模块、数据采集模块、数据预处理模块、特征工程生成模块、患者聚类建模模块、诊疗方案推荐模块依次连接,数据库与数据采集模块连接。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中电科软件信息服务有限公司,未经中电科软件信息服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710057343.5/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





