[发明专利]一种基于梯度提升树的蚊媒传染病疫情预测方法及系统有效
申请号: | 201810097508.6 | 申请日: | 2018-01-31 |
公开(公告)号: | CN108172301B | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 张凤军;邱晓慧;周红宁;杜龙飞;梁赓;王鑫 | 申请(专利权)人: | 中国科学院软件研究所 |
主分类号: | G16H50/80 | 分类号: | G16H50/80 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 安丽 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 梯度 提升 传染病 疫情 预测 方法 系统 | ||
本发明公开了一种基于梯度提升树的蚊媒传染病疫情预测方法及系统:广泛收集影响蚊媒传染病的各种因素数据;对影响蚊媒传染病的数据进行清洗,进而对影响蚊媒传染病因素基于梯度提升树进行重要性排序;根据选取影响蚊媒传染病的重要因素建立基于泊松回归的蚊媒传染病疫情预测模型;利用选取因素与蚊媒传染病疫情相关系数初始化预测模型,之后用S折交叉验证确定蚊媒传染病预测模型参数;利用基于地理信息的疫情热点图与基于时间轴的疫情爆发图可视化展示模型预测结果。本发明将梯度提升树等机器学习方法应用到蚊媒传染病疫情预测领域,可提高蚊媒传染病疫情预测准确率,辅助疾控人员提前预测蚊媒传染病疫情态势,及时采取相应措施控制传染病大规模爆发。
技术领域
本发明涉及一种基于梯度提升树的蚊媒传染病疫情预测方法及系统,属于计算机应用领域。
背景技术
随着全球气候的变暖、城市化进程的加快、世界各国贸易往来的频繁以及国际间交通工具运输的快捷便利、生态环境的不断恶化,全球蚊媒传染病发病呈上升趋势,原有蚊媒传染病的流行区域不断扩展、疾病的流行频度不断增强。使得原本局限于某一地域或者国家内的疾病突破国境的界限,引起在世界范围内的广泛传播与流行,曾经或正在流行的蚊媒传染病给世界人民带来了巨大危害。因此,对蚊媒传染病的研究迫切需要。
蚊媒传染病是人—蚊—人的传播模式,其具有复杂的时空变异性,受多尺度、随机性、过程特征复性等多因素影响,因果关系之间具备强非线性相关性,预测存在难度。近年来,许多研究者致力于蚊媒传染病研究。大部分基于传统统计方法预测蚊媒传染病疫情态势,如基于时间序列的季节性自回归模型,ARIMA分析等。蚊媒传染病受多种因素影响,不同因素影响程度不同,预测时需综合考虑所有因素。但这些模型考虑因素单一,仅考虑一个或者二个,而且大部分基于经验确定影响因素,预测准确率低,不能较好的应用到实践。
部分研究者将简单的机器学习方法用到蚊媒传染病疫情态势预测中。例如,利用logistic回归基于气象信息来预测蚊媒传染病的出现与否,将月平均降水、最高最低以及平均温度,水汽压力作为模型参数。有研究者研究了温度对蚊媒传染病传播速度的影响,同时基于气象因素计算蚊媒传染病疫情预测参数,进而预测蚊媒传染病态势。但这些模型考虑的因素皆较少,大都基于气象因素,忽略了地理、人文等多方面因素。同时,已有研究都没进行充分的数据清洗与特征选择。原始数据存在很多缺失、重复、不规范的情况,直接建模会对模型预测精度产生较大影响。另一方面,有些因素对传染病影响较小,另外一些因素对其影响较大,当因素较多时,仅依靠经验、已有研究来选择因素,不能有效选出合适因素来建立蚊媒密度预测模型。此外,通过对蚊媒传染病发病态势情况分析,可利用符合态势分布的机器学习模型来预测蚊媒传染病爆发态势。
发明内容
本发明技术解决问题:克服现有技术中存在的不足,提供一种基于梯度提升树的蚊媒传染病疫情预测方法及系统,具有科学可行、预测准确度高的优点,不仅综合考虑影响蚊媒传染病的因素,有效的选取特征,而且建立确切预测模型,极大提高蚊媒传染病疫情态势预测准确率。
本发明解决其技术问题所采用的技术方案是:一种基于梯度提升树的蚊媒传染病疫情预测方法,包括以下步骤:
第一步,收集影响蚊媒传染病疫情的多种因素数据并预处理;
第二步,对预处理后的所述多种因素数据采用梯度提升树方法,计算每个因素数据的重要度并排序,根据重要度顺序选取若干因素数据作为特征数据;
第三步,使用所述特征数据训练预测模型,确定所述预测模型的最优参数;
第四步,通过所述预测模型和最优参数,完成蚊媒传染病疫情预测;
第五步,可视化展示蚊媒传染病疫情预测态势。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810097508.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种确定皮肤状态变化的年龄拐点的方法
- 下一篇:合理用药信息监测方法及系统