[发明专利]2型糖尿病发病危险因素对血糖影响的定量分析方法有效
| 申请号: | 201310074038.9 | 申请日: | 2013-03-08 |
| 公开(公告)号: | CN103198211B | 公开(公告)日: | 2017-02-22 |
| 发明(设计)人: | 罗森林;陈松景;潘丽敏;韩龙飞;张铁梅 | 申请(专利权)人: | 北京理工大学 |
| 主分类号: | G06F19/00 | 分类号: | G06F19/00;G06N3/08 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100081 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 糖尿病 发病 危险 因素 血糖 影响 定量分析 方法 | ||
技术领域
本发明涉及一种多因素对血糖影响的定量分析方法,属于生物信息处理及医学领域。
背景技术
2型糖尿病已经成为世界性的一个主要健康问题。预计到2025年,全世界将有3.8亿人受到糖尿病的困扰。目前,我国已成为仅次于印度的糖尿病第二大国。据卫生部调查显示,我国糖尿病患者每天约新增3000例,每年约新增120万例,其中约95%为2型糖尿病患者。2型糖尿病已成为继癌症和心脑血管病之后,位于第三位严重影响人类健康的慢性病,其病因是环境因素、遗传因素、生活方式等相互作用的结果。目前已经获得共识的患病危险因素包括增龄、肥胖超重、血脂、血压水平异常、糖尿病家族史等,多因素共同作用对血糖水平升高产生影响,进而导致发病。
由于2型糖尿病一旦发病难以治愈,如果在发病前对危险因素进行干预,能够有效降低发病率,提高生活质量。相关研究大多采用多元回归、元分析、cox回归等统计学方法,利用相对危险度研究危险因素与是否发病之间的关系。哈佛大学Hu F B等人的研究表明超重和肥胖是发生2型糖尿病的最重要因素。通过对比发现,3.4%处于低危险组女性发生糖尿病的相对危险度为0.09,91%的发病者是由于不健康生活习惯造成的。Mhurchu C N等人采用cox回归方法报道了亚太地区人群的体重指数和糖尿病发生之间联系,发现在该地区降低体重指数能有效降低糖尿病的发病率。或采用多元回归算法和元分析,研究通常用相对危险度说明某一因素是否是发生2型糖尿病相关的危险因素,给出定性的结论。本发明采用BP神经网络算法计算敏感度,量化衡量危险因素对血糖变化的影响,通过敏感度反映出危险因素的变化对血糖变化的影响,用敏感度比较说明危险因素对血糖变化的定量影响程度,是对血糖变化特点与规律的过程相关因素探索,用于指导相应干预措施,尽早控制血糖的升高趋势,达到预防控制糖尿病发生的目的。
发明内容
本发明的目的是为解决多因素对血糖影响定量分析的问题,提出一种基于BP神经网络的定量分析方法。
本发明的设计原理为:使用C4.5和EM聚类算法筛选出主要的危险因素,用以确定定量分析的对象;对未患有2型糖尿病的全国抽样人群体检数据,根据性别和年龄进行人群划分;使用BP神经网络算法定量分析危险因素对血糖变化的影响。本发明在筛选出危险因素的同时对人群进行细化,通过定量分析多因素对血糖影响,在给出细化人群中多因素对血糖影响量化表示,且不同细化人群的多因素的量化排序不同,为个体细化干预提供判定方法。
本发明的技术方案是通过如下步骤实现的:
步骤1,获取人群体检数据,形成未患有2型糖尿病的全国抽样人群体检数据源S。
具体方法为:为通过2001-2008年实测体检数据,得到完整可用的数据源,对体检数据进行预处理,首先通过数据清理,填充空缺值、识别孤立点、消除噪声并纠正数据中的不一致;再进行数据变换包括数据格式转换、数据语义的转换;最后保证在信息不丢失的情况下,通过数据规约删除重复因素和空缺值过多的因素,得到全国抽样人群体检数据源S={s1,s2,s3,…,sk},其中k为预处理后体检人的总数。
步骤2,在步骤1的基础上,进行主要危险因素的筛选。具体过程如下:
步骤2.1,数据处理实验参数设定模块。根据数据源S选择进行主要危险因素筛选的算法,并设定算法的参数。
步骤2.2,EM聚类算法模块。
具体方法为:对数据源S进行聚P类或q类的聚类实验,改变参与实验的危险因素的数量和种类,观察实验结果,得到能够较好反映出人群特点的聚类结果,记录参与聚类的危险因素。
步骤2.3,EM聚类、C4.5分类组合实验。
具体方法为:EM聚类实验部分的参与因素为上述聚类实验所得的最佳聚类因素,进行聚P类或q类的聚类实验,将数据源S按不同人群健康特点分开,在对不同健康特点的人群分别使用C4.5算法进行分析,分类参与因素为全部l维危险因素,分类实验的标定门限值分别为R、V、T和Z,得到不同健康特点人群所对应的分类决策树。
步骤2.4,对实验结果进行统计,得到c维主要危险因素,根据医学认知,进一步筛选得到u维主要危险因素。步骤3,根据性别和年龄,对经步骤2得到的全国抽样人群体检数据源S进行划分,生成细化人群。
具体方法为:首先按性别划分,得到男性人群和女性人群;再分别按年龄大于e岁和小于等于e岁进行划分,共得到d组细化人群。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310074038.9/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





