[发明专利]基于广义回归神经网络的短期腹泻病多步预测方法在审
申请号: | 201410234345.3 | 申请日: | 2014-05-29 |
公开(公告)号: | CN104008164A | 公开(公告)日: | 2014-08-27 |
发明(设计)人: | 顾君忠;周子力;王永明;林晨;兰小敏;陈继智;相晓敏 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N3/02;G06Q10/04;G06Q50/22 |
代理公司: | 上海蓝迪专利事务所 31215 | 代理人: | 徐筱梅;张翔 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 广义 回归 神经网络 短期 腹泻 病多步 预测 方法 | ||
技术领域
本发明涉及数据挖掘技术领域,具体地说是一种基于广义回归神经网络,在缺乏气象数据或者同时具备气象数据和腹泻数据的情况下,分别对儿童及成人的腹泻病进行多步预测的方法。
背景技术
近年来,人类社会产生越来越多的数据,促进了数据挖掘技术的快速发展。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的,人们事先不知道的,但又潜在有用的信息和知识的过程。
目前,数据挖掘技术已经被应用到金融、制造业、保险业等多个领域。如何利用数据挖掘技术对流行病进行预测引起了不少关注。不少学者试图在各种气象影响因素与腹泻病发病率或发病人数之间建立数学模型,预测在不同的气象因素作用下腹泻发病的变化,但均存在一些不足:
第一种技术是基于传统的统计学方法。这类方法无法很好地反映气象因素与腹泻发病人数之间复杂的非线性关系,预测效果往往不能令人满意;用于建立腹泻预测模型的历史样本数据以及气象数据偏少,从而造成不能很好地挖掘数据中所蕴藏的知识;已有的腹泻预测模型或仅以外部气象因素进行预测的模型,在缺少气象因素数据的情况下无法进行预测;或仅通过腹泻病例历史数据进行时间序列预测,没有同时兼顾这两种情况进行腹泻病的预测;已有的腹泻预测模型多以月腹泻发病人数为预测项,缺乏早期(逐日预测)预测预报功能。
第二种技术是基于BP人工神经网络的方法。BP人工神经网络虽然具有非线性映射能力、自学习和自适应能力、泛化能力、容错能力等优点,但是存在局部极小化问题,容易导致训练失败,同时BP人工神经网络对于初始值非常敏感,不同的初始值往往导致其收敛于不同的局部极小值点;由于BP人工神经网络的目标函数非常复杂,导致其训练速度很慢;BP人工神经网络的预测能力对于训练数据的典型性有较高要求;由于BP人工神经网络的参数较多,即使同样的网络结构和参数,训练最优模型仍需要花费较多时间。
发明内容
本发明的目的是针对现有技术的不足而提供的一种基于广义回归神经网络的短期腹泻病多步预测方法,该方法能够分别针对儿童和成人以及在缺乏气象数据或者同时具备气象数据和腹泻数据的情况下,建立对应的模型,进行多步的预测,得到令人较满意的预测结果。
实现本发明目的的具体技术方案是:
一种基于广义回归神经网络的短期腹泻病多步预测方法,该方法包括以下具体步骤:
(1)训练数据和测试数据:在5~7年某地区腹泻发病人数和气象数据中选择最近一年的腹泻发病人数和气象数据作为测试数据,剩余几年的腹泻发病人数和气象数据作为训练数据;
(2)数据预处理:对训练数据进行数据清洗和归一化处理;
(3)相关性分析:对训练数据进行Spearman相关性分析,从中选择显著相关的气象因素;
(4)主成分分析:对步骤(3)选择的因素进行主成分分析,提取特征;
(5)基于广义回归神经网络建模:以步骤(4)提取的特征作为广义回归神经网络的输入,采用高斯函数作为径向基函数,输出腹泻发病预测结果,对广义回归神经网络进行仿真训练,确定广义回归神经网络的权值和阈值,对儿童和成人分别建立24小时单元或多元多步预测模型,通过将数据输入预测模型获得预测结果,按百分位数法对预测结果进行等级划分;
所述步骤(1)中气象数据为日平均气温、日最高气温、日最低气温、日最低相对湿度、日平均相对湿度、日平均气压、日平均风速、日照时数和日累计降雨量。
所述步骤(2)中对训练数据进行数据清洗和归一化处理;具体包括:
数据清洗是检查数据一致性,针对训练数据中存在的缺失数据、噪声数据、错误数据、冗余数据分别进行处理:
缺失数据:使用缺失数据前后一周的数据的平均值进行填充;
噪声数据:通过画散点图识别噪声数据,然后由用户进行确认及更正;
错误数据:通过和用户确认的方式纠正错误数据;
冗余数据:人工删除冗余数据;
归一化处理是为了加快广义回归神经网络的收敛速度,采用公式(1)对训练数据进行归一化处理:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410234345.3/2.html,转载请声明来源钻瓜专利网。