[发明专利]一种基于决策树和改进SMOTE算法的哮喘病诊断系统有效
申请号: | 202110302072.1 | 申请日: | 2021-03-22 |
公开(公告)号: | CN112951413B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 刘志锋;马芽;崔玉宝;陈文;夏莉敏;周从华 | 申请(专利权)人: | 江苏大学 |
主分类号: | G16H50/20 | 分类号: | G16H50/20;G16H50/70;G06F18/23213 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 212013 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 决策树 改进 smote 算法 哮喘病 诊断 系统 | ||
本发明属于数据挖掘领域,具体涉及一种基于决策树和改进SMOTE算法的哮喘病诊断系统。本发明利用血常规数据和哮喘患者的血常规体检数据,采用粒子群优化算法对SMOTE过采样技术的采样率进行优化,得到一种改进的SMOTE过采样技术,利用决策树对数据建模诊断。本发明可以根据患者的血常规体检数据自动诊断是否患有哮喘病,降低了因医生疲劳、判断失误或经验不足的影响,同时提高了诊断哮喘病的效率。
技术领域
本发明涉及数据挖掘领域,具体涉及一种基于决策树和改进SMOTE算法的哮喘病诊断系统。
背景技术
支气管哮喘(简称哮喘)是由多种细胞(如嗜酸性粒细胞、肥大细胞、T淋巴细胞、中性粒细胞、气道上皮细胞等)和细胞组分、参与的气道慢性炎症性疾病。哮喘属于气道慢性应变性炎症反应,患者急性发作临床表现为反复喘息、呼吸困难、胸闷咳嗽,运动耐受性下降并伴有气道高反应性、梗阻性。哮喘是一种严重危害人体健康的慢性呼吸道疾病,其发病率高且不能治愈。严重影响了患者的正常工作与生活。更有不少患者得不到及时的治疗或者治疗方法的错误,使肺部功能进一步的受损。哮喘严重发病时,若得不到及时的干预治疗,甚至会危及患者的生命安全。
据统计,世界约有3亿人受到哮喘病的影响,而且受影响的患者数量呈指数增长,到2025年,有可能再有1亿人受到这种疾病的影响。常用评估哮喘病情的方法如痰涂片观察嗜酸性粒细胞、肺功能(SPIR)和脉冲震荡测量(IOS)等,但不易检测、费时费力、费用昂贵。以上的检测手段需要大量有专业知识和诊断经验的从业人员,但是患病基数大,从业人员的数量相对较少。这样会给医务人员带来极大的疲劳,甚至容易导致误诊误。而且因为缺少统一的临床指标,不同的医生会给出不同的诊断结果,具有较大的限制性和危险性。些病人常以发作性咳嗽为唯一症状,临床上常易误诊为支气管炎,有的青少年病人则以运动时出现胸闷,气紧为唯一临床表现,若对哮喘的认识不够,或临床诊断思路不正确,很容易导致误诊或漏诊。
发明内容
针对现有技术中存在问问题,本发明针对哮喘病疾病,利用从医院相关部门获得的哮喘病人血常规数据,结合机器学习的数据挖掘相关算法,建立一个哮喘病诊断模型系统,达到给医生辅助临床诊断的目的,做到早诊断,早治疗,降低哮喘病人的发病率。
为实现上述发明目的,本发明提出一种基于决策树和改进SMOTE算法的哮喘病诊断系统,包括数据采集与处理模块、过采样处理模块、决策树训练模块、检测模块和诊断应用模块;所述数据采集与处理模块用于采集血常规体检数据,并对采集的数据进行缺失值清洗、填充缺失值内容或重新取数、删除内容不符合数据、去除重复值或不合理值,保证数据之间的正确关联性处理;离散数据进行One-Hot编码处理;将预处理后的数据输入过采样处理模块;所述过采样处理模块用于对输入的数据进行处理,将PSO与SMOTE优化算法处理平衡后的数据分为训练样本集和验证样本集两组;所述决策树训练模块采用CART回归树算法搭建哮喘病诊断模型,使用MEP后剪枝算法计算误差并进行剪枝,避免欠拟合风险;再利用训练样本集进行哮喘病诊断训练;所述检测模块用于加载训练好的哮喘病诊断模型,利用验证样本集对训练好的哮喘病诊断模型进行验证;所述诊断应用模块利用训练好的哮喘疾病诊断模型作为最终应用模型,用于哮喘病的辅助诊断。
进一步地,上述数据采集与处理模块包括数据采集和数据清洗,具体包括以下内容:
数据采集:获取血常规数据;
缺失值清洗:确定缺失值范围,对每个字段计算缺失值比例,按照缺失值比例和字段重要性,采用以下的方式清洗:去除不需要字段、无意义的字段;填充缺失值的内容或重新取数;
格式内容清洗:时间日期数值显示格式、内容中不该存在的字符、字段内容与该字段应有内容不符;
逻辑错误清洗:包括去重、去除不合理值、修正矛盾内容;
非需求数据清洗:对不需要的字段进行删除处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110302072.1/2.html,转载请声明来源钻瓜专利网。