[发明专利]一种基于医疗大数据挖掘的慢性病风险模型的构建方法有效
| 申请号: | 201510531445.7 | 申请日: | 2015-08-26 |
| 公开(公告)号: | CN105095673B | 公开(公告)日: | 2018-03-13 |
| 发明(设计)人: | 李非;伯晓晨;徐文剑;罗一夫 | 申请(专利权)人: | 中国人民解放军军事医学科学院放射与辐射医学研究所 |
| 主分类号: | G16H50/70 | 分类号: | G16H50/70;G16H50/50 |
| 代理公司: | 北京纪凯知识产权代理有限公司11245 | 代理人: | 徐宁,孙楠 |
| 地址: | 100039*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 医疗 数据 挖掘 慢性病 风险 模型 构建 方法 | ||
技术领域
本发明涉及一种模型的构建方法,特别是关于一种基于医疗大数据挖掘的慢性病风险模型的构建方法。
背景技术
心脏病、脑卒中、肿瘤、慢性呼吸道疾病、糖尿病等慢性病造成严重的社会负担,并呈现出快速上升和年轻化趋势。世界卫生组织2005的一项报告显示对心脏病、中风、癌症和其他慢性病长期存在的误解助长了全球对它们的忽视:2005年因慢性病造成的死亡人数将达3500万,其中80%以上发生在低收入和中等收入国家。报告强调了对慢性病的日益严重性要有所预测和了解,并紧急对其采取行动,这就要求那些能够加强慢性病预防和控制工作的各国领袖以及国际公共卫生界对此采取新的策略,其中,至关重要的第一步是将最新和最准确的知识和信息传授给一线卫生专业人员和广大公众。
遗传因素和不健康生活方式是慢性病发生的根本原因,家庭成员相似的遗传背景和共同的生活习惯,使得慢性病的发生常表现出明显的家族聚集性。高血压、糖尿病、血脂异常、肥胖、冠心病、脑卒中和肿瘤均为多基因遗传病,同时受环境和心理因素的影响。遗传因素与环境因素作用的总和决定一个人是否易于患病,即易患性,这种易患性高到一定的程度(超过阈值)时才会发病。显然,为预防发病,疾病的遗传度越高,就越应该注意控制环境和心理因素的影响,以防止其易患性达到发病的阈值。那种只讲遗传,忽视可改变危险因素干预的宿命论观点是完全错误的,事实上,80%以上的心脏病、脑卒中和糖尿病,40%以上的肿瘤都是可以预防的。
年龄、性别、遗传、高血压、糖尿病、血脂异常、超重和肥胖、不健康膳食、缺乏身体活动、吸烟、精神压力过大、过量饮酒等都是慢性病事件的危险因素。除年龄、性别和遗传背景无法改变外,其他危险因素都是可以干预的。慢性病危险因素间常存在协同作用,即两个危险因素同时存在时,其致病作用远远高于两个因素单独存在时的作用之和。因此,针对所有危险因素进行综合干预效果是最好的。
合理的科学依据为综合或者特定慢性病的健康评估模型,健康评估起源于临床护理,最初是对疾病损害程度的判断工具,后来演化为临床决策和预测的有力助手,基本方法是问卷量表、体检问卷、临床指数公式、评分表和评估模型,采集数据的来源可以是体检数据和各大医院的医疗病例记录。针对某种慢性病的评估模型能够在一定可靠度下对人群的发病风险程度进行划分。
因此,进一步推进我国慢性病高危人群筛查及干预工作、探索其有效防治途径与策略至关重要,可有效提高我国居民发病危险因素知晓率和控制率,降低慢性病的发生率、复发率、死亡率和致残率,从而减轻慢性病给社会和家庭带来的经济负担和疾病负担,提高国民健康水平。
现有慢性病风险模型参差不齐,多数过于简单,缺乏数据支持,不够精确、危险程度划分过粗糙、高危人群过于广泛等缺陷。
发明内容
针对上述问题,本发明的目的是提供一种精确合理、简单易用的基于医疗大数据挖掘的慢性病风险模型的构建方法。
为实现上述目的,本发明采取以下技术方案:一种基于医疗大数据挖掘的慢性病风险模型的构建方法,其包括以下步骤:
1)确定慢性病的若干个危险因素,获得参与调查的人群含有危险因素及是否患有慢性病的医疗统计数据;
2)对慢性病的若干个危险因素进行任意组合获得n种危险因素组合,其中,n为正整数;将每个危险因素组合作为关联规则中的先导X,将慢性病作为关联规则中的后继Y,计算每个危险因素组合在医疗统计数据中的支持度和置信度;
3)设置最小支持度和最小置信度,在n种危险因素组合中选择出支持度和置信度在最小支持度和最小置信度以上的危险因素组合;
4)通过危险因素组合构建慢性病风险模型,其为慢性病与每种危险因素同时出现的概率,具体是指每种危险因素在支持度和置信度高于最小支持度和最小置信度的危险因素组合中出现的概率。
所述步骤2)中,每个危险因素组合在医疗统计数据中的支持度为既包含危险因素组合且又包含慢性病的数据在临床统计数据中的概率;每个危险因素组合在临床统计数据中的置信度为既包含危险因素组合且又包含慢性病的数据在包含危险因素组合的数据中的概率。
所述步骤4)中,所述每种危险因素在支持度和置信度高于最小支持度和最小置信度的危险因素组合中出现的概率pi为:
pi=ni/N;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军军事医学科学院放射与辐射医学研究所,未经中国人民解放军军事医学科学院放射与辐射医学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510531445.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:面向返回的编程作为混淆技术
- 下一篇:基于亚洲极涡因子的电网覆冰长期预报方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





