[发明专利]医疗大数据分析方法与装置有效
申请号: | 201711287373.1 | 申请日: | 2017-12-07 |
公开(公告)号: | CN107967948B | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 陈晓蕾;周雄志;邓松 | 申请(专利权)人: | 泰康保险集团股份有限公司 |
主分类号: | G16H70/00 | 分类号: | G16H70/00;G16H50/70 |
代理公司: | 隆天知识产权代理有限公司 72003 | 代理人: | 李昕巍;章侃铱 |
地址: | 100031 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 医疗 数据 分析 方法 装置 | ||
本公开提供一种医疗大数据分析方法,医疗大数据分析方法包括:使用多名患者的就诊数据训练LASSO模型以生成第一ICD编码集合;将所述第一ICD编码集合与预设ICD编码集合的并集作为第二ICD编码集合;使用所述第二ICD编码集合以及所述就诊数据训练回归模型以产生参数集;根据所述第二ICD编码集合以及所述参数集生成分析模型。本公开提供的医疗大数据分析方法可以建立精准的医疗数据分析模型。
技术领域
本公开涉及机器学习技术领域,具体而言,涉及一种建立医疗数据分析模型的医疗大数据分析方法。
背景技术
健康管理是20世纪50年代末最先在美国提出的概念(Managed Care),其核心内容医疗保险机构通过对其医疗保险客户(包括疾病患者或高危人群)开展系统的健康管理,有效控制疾病的发生或发展,显著降低出险概率和实际医疗支出。
对于医疗保险机构而言,相关的健康管理方法往往是通过循证医学筛选影响单病种患病概率的入模变量,结合循证医学取样范围内的医疗数据建立对于单病种的患病概率分析模型,从而分析被保险人的健康状况。然而,循证医学结论往往具有较弱的时效性和地域性,无法提供对某一地区最近一段时间的精准分析,所以,为了提高疾病患病概率预测的精确度和时效性、地域性,需要建立更精确的分析模型。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于利用大数据手段改进原有依靠医学经验筛选入模变量建立数据分析模型的方法,依靠大数据下LASSO和循证医学相结合的变量筛选方式,建立精准的医疗数据分析模型。
根据本公开的第一方面,提供一种医疗大数据分析方法,包括:
使用多名患者的就诊数据训练LASSO模型以生成第一ICD编码集合;
将所述第一ICD编码集合与预设ICD编码集合的并集作为第二ICD编码集合;
使用所述第二ICD编码集合以及所述就诊数据训练回归模型以产生参数集;
根据所述第二ICD编码集合以及所述参数集生成分析模型。
可选的,所述使用多名患者的就诊数据训练LASSO模型包括:
将连续n年参加社会医保的患者的就诊数据与第n+1年首次患有预设疾病的患者的信息按照ICD编码做二进制处理;
根据患者的身份信息、二进制处理后的所述患者的就诊数据以及所述患者首次患所述预设疾病的信息生成的包括多名患者就诊数据的宽表;
将所述宽表输入所述LASSO模型,训练所述LASSO模型输出所述就诊数据中的每个ICD编码与所述预设疾病的关联参数。
可选的,所述生成第一ICD编码集合包括:
根据所述LASSO模型的训练结果获取所述就诊数据中的多个ICD编码的回归系数;
根据回归系数大于阈值的ICD编码生成所述第一ICD编码集合。
可选的,所述预设ICD编码包括根据循证医学选取的影响预设疾病患病概率的ICD编码。
可选的,所述产生参数集包括:
根据所述回归模型的训练结果获取所述第二ICD编码集合内的ICD编码的回归系数;
根据大于预设值的回归系数与其对应的ICD编码生成所述参数集。
可选的,所述产生参数集还包括:
根据所述回归模型的训练结果获取所述就诊数据内其他特征的回归系数,所述其他特征至少包括患者年龄、性别;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于泰康保险集团股份有限公司,未经泰康保险集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711287373.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置