[发明专利]一种基于机器学习的新冠肺炎数据处理方法及预测系统在审
申请号: | 202010332419.2 | 申请日: | 2020-04-24 |
公开(公告)号: | CN111524599A | 公开(公告)日: | 2020-08-11 |
发明(设计)人: | 樊俊青;曹元奎;李婕;陈云亮;刘传礼;杨红丽;芮法娟;张思敏;李建新 | 申请(专利权)人: | 中国地质大学(武汉) |
主分类号: | G16H50/30 | 分类号: | G16H50/30;G16H50/20;G06K9/62 |
代理公司: | 北京金智普华知识产权代理有限公司 11401 | 代理人: | 杨采良 |
地址: | 430074 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 肺炎 数据处理 方法 预测 系统 | ||
本发明属于医学疾病预测技术领域,公开了一种基于机器学习的新冠肺炎数据处理方法及预测系统,对新冠肺炎的医学病例数据集中的部分缺失值进行填充,并采用Pearson相关系数对病例数据集进行特征选择,得到提取后的病例数据特征;采用得到的特征数据以及原始病例数据中的轻重症情况数据组成样本数据,按一定比例分成训练数据和测试数据,并利在训练数据上进行训练;利用测试数据对训练后的方法进行测试,最终得到新冠肺炎症状数据处理方法,并与其他机器学习预测方法进行比较。本发明提供的新冠肺炎数据处理方法可以筛选出与新冠肺炎病情相关性较大的属性,具有较好的准确性和有效性。
技术领域
本发明属于医学疾病预测技术领域,尤其涉及一种基于机器学习的新冠肺炎数据处理方法及预测系统。
背景技术
以计算机技术为依托,采用机器学习方法对新型冠状病毒肺炎病例数据进行预测分析,可以帮助医护人员快速准确地分辨病例的轻重症,发挥计算机技术战“疫”价值。朴素贝叶斯(Naive Bayes)分类器发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时所需估计的参数很少,对缺失数据不太敏感,也比较简单。理论上,朴素贝叶斯方法与其他分类方法相比具有最小的误差率。朴素贝叶斯方法的健壮性比较好,对于不同类型的数据集不会呈现出太大的差异性。当数据集属性之间的关系相对比较独立时,朴素贝叶斯分类方法会有较好的效果。
通过上述分析,现有技术存在的问题及缺陷为:(1)现有技术,结合计算机对新冠肺炎轻重症数据进行预测准确性差。目前新冠肺炎病例数据样本不多,病情复杂,人们对其认识不够充分,经验不足,现有技术大多依赖已有经验,因此难以对其进行准确的预测。
(2)现有技术,结合计算机对新冠肺炎轻重症数据进行预测方法较少。新冠肺炎爆发至今的时间不长,因此结合计算机对新冠肺炎轻重症数据进行预测的方法还没有被大量地发布或提出。
解决以上问题及缺陷的难度为:中等。机器学习是一种多层描述的表征学习,通过组合简单、非线性模块来实现。机器学习已经进行了许多与疾病相关的研究。机器学习技术可以从数据中寻找规律,建立关系,对数据的依赖较大,对经验的依赖较小,因此很好地避免了现有技术存在的问题。
解决以上问题及缺陷的意义为:在目前对新冠肺炎认识不足以及预测方法不多的情况下,本实施例的方法可以根据患者体检的病理特征,快速准确地帮助医护人员分辨病例的轻重症,以对患者采取对应的治疗措施。
发明内容
针对现有技术存在的问题,本发明提供了一种基于机器学习的新冠肺炎数据处理方法及预测系统。
本发明是这样实现的,一种新冠肺炎症状轻重预测系统,包括:
病例数据特征获取模块,用于对新冠肺炎的医学病例数据集中的部分缺失值进行填充,并采用Pearson相关系数对病例数据集进行特征选择,得到提取后的病例数据特征;
数据训练模块,对病例数据特征获取模块得到的特征数据以及原始病例数据中的症状情况数据组成样本数据,按比例分成训练数据和测试数据,并利用Naive Bayes方法在训练数据上进行训练;
新冠肺炎症状预测数据获取模块,对数据训练模块训练后数据进行测试,得到新冠肺炎症状预测数据,并与其他机器学习预测方法进行比较。
进一步,所述病例数据特征获取模块包括:
填充缺失值模块,用于对新冠肺炎的医学病例数据集中的部分缺失值使用气促、咳嗽、腹泻的表现症状数据以及血常规、肝功生化、凝血、血气的医学检测数据的平均值作为填充数据进行填充;
特征选择模块,用于计算每一属性与原始病例数据中的症状情况数据的Pearson系数,并取相关性大于0.2的属性作为训练数据的属性。
进一步,所述数据训练模块包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010332419.2/2.html,转载请声明来源钻瓜专利网。