[发明专利]一种环境变化对疾病发病影响的分析预测装置有效
| 申请号: | 201510170135.7 | 申请日: | 2015-04-10 | 
| 公开(公告)号: | CN104809335B | 公开(公告)日: | 2019-03-05 | 
| 发明(设计)人: | 杨冬艳;马成龙;张敬谊;于广军;李光亚;陈诚 | 申请(专利权)人: | 上海卫生信息工程技术研究中心有限公司;万达信息股份有限公司 | 
| 主分类号: | G16H50/70 | 分类号: | G16H50/70 | 
| 代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 翁若莹 | 
| 地址: | 200233 上海市徐*** | 国省代码: | 上海;31 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 环境 变化 疾病 发病 影响 分析 预测 模型 | ||
1.一种环境变化对疾病发病影响的分析预测装置,其特征在于,包括:
输入输出数据模块,该输入输出数据模块的输入数据为:整理好的气象和环境污染因子的时序数据;该输入输出数据模块的输出数据为:各科室门诊量;
数据预处理模块,用于:
对气象和环境污染因子决策矩阵进行归一化处理,其中,xij表示第i天的第j项气象和环境污染因子的数据指标;再计算归一化后的决策矩阵X的相关系数矩阵其中rij表示第i天的第j项气象和环境污染因子数据指标的相关系数,且rij=rji;同时计算气象和环境污染因子与各科室门诊量的相关系数矩阵R;
非参数泊松回归模型模块,用于:
1)构建非参数泊松回归模型,采用三次样条平滑函数拟合非线性自变量,并引入年份和周日亚元变量,消除自变量间自相关性和长期季节趋势的影响,为了得到气象和环境污染因子对门诊量的定量研究结果,将气象因子和环境污染因子作为变量引入模型,分别观察其对门诊量的影响:
log[E(Yi)]=a+ns[Xi]+YEAR+DOW+s(meteorology,df)+s(environment,df)
式中,Yi为第i个观察日当天的门诊量;E(Yi)为第i个观察日门诊量的期望值;a为截距;Xi为第i个观察日气象环境污染因子的分指数,DOW为周日亚元变量;s(meteorology,df)为气象因子的三次样条平滑函数;s(environment,df)为环境污染因子的三次样条平滑函数;YEAR为年份亚变量;
2)脆弱性分析:分析当气象和环境污染因子变化某个单位时,对门诊量的影响程度,根据非参数泊松回归模型计算出各气象和环境污染因子的回归系数β,计算当各气象和环境污染因子变化四分位间距IQR时,门诊量自然对数的相对改变量,公式:[exp(β×IQR)-1]×100%,并在此基础上计算平均百分比改变的95%的置信区间;
3)敏感性分析:分析当气象因子和环境因子变化时,将在多长时间内对门诊量造成影响,采用滞后效应进行研究,选择分析滞后期lag为0~7天的气象和环境污染因子效应,最后,根据非参数泊松回归模型计算出回归系数β,由β计算出不同滞后天数的RR值,根据RR值确定最佳滞后期;
降维模块,用于:求取相关系数矩阵R所对应的J个特征根以及特征向量,每个特征根对应一个主成分,并选取累积方差贡献度大于等于指定阀值的主成分,则从J个主成分中筛选出p个主成分及特征向量;计算各个主成分因子在各个变量上的成分得分矩阵,得到p个主成分在每周的得分;
数据分区模块,采用交叉验证的方法将输入向量矩阵及输出变量分为训练集和测试集,输入向量矩阵为p+2维,由降维模块中得到的主成分得分与年份亚变量和节假日变量组合构成,输出变量为下周的科室就诊人数平均值;
构建支持向量回归机模块,包括如下步骤:
第一步、模型参数选择,用于构建支持向量回归机的输入和输出,并且选择支持向量回归机的特征参数,其中,特征参数包括核函数、初始的惩罚因子C和核函数参数δ的试凑范围与步长,以及初始的精度参数ε,通过核函数将数据映射到高维的向量空间中,在约束条件,其中,xi为l维空间的输入向量,yi为l维空间的输出向量,w为特征空间连接到输出空间的权值参数,φ(x)为x在特征空间的像,b为偏置或者负阀值:
<w,φ(xi)>+b-yi≤ξi*+ε,i=1,...,l
yi-<w,φ(xi)>-b≤ξi+ε,i=1,...,l
ξi,ξi*≥0,i=1,...,l
求解目标函数,其中,C为选定的正参数:
该问题的对偶形式为:
其中约束条件为:
0≤αi,αi*≤λiC,i=1,2,...l
从而求解出参数αi和αi*;
第二步、训练模型,调用训练函数,输入训练集样本,计算出支持向量以及求解对应的参数,得到支持向量回归机:
根据支持向量回归机计算各科室就诊人数的预测值,计算实际输出与期望输出之间的MAE以及模型的拟合优度R2作为对模型拟合能力评价指标,判断回归函数f(x)是否满足性能要求,若回归函数f(x)不满足性能要求,则需要调整支持向量回归机中的核函数和特征参数重新训练模型,并保存最终结果;
第三步、根据回归预测分析最佳的参数得到的支持向量回归机计算各科室就诊人数的预测值;
模型预测能力评估模块,其实施过程包括:
第一步、用支持向量回归机计算医院各科室的就诊人数的预测值;
第二步、获取各科室就诊人数的实际值,各科室就诊人数的预测值和实际值是同一时间段的就诊人数;
第三步、计算预测值与实际值之间的差异,并根据误差图对模型的预测效果进行评估,若模型的预测能力较差,则需要重新选择模型参数、重新训练模型,从而构建基于支持向量回归机的气象环境污染因子的就诊人数预测模型;
在构建支持向量回归机模块的第二步的训练模型中,模型拟合能力评价指标:实际输出与期望输出之间的均方误差MAE以及拟合优度R2由下面的公式给出:
式中,表示第i周的日平均就诊人数的预测值,yi表示第i周的日平均就诊人数的真实值,n,0<n<I,表示周数,其中MAE越小和R2越接近于1,表示所建立的支持向量回归机越具有良好的泛化能力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海卫生信息工程技术研究中心有限公司;万达信息股份有限公司,未经上海卫生信息工程技术研究中心有限公司;万达信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510170135.7/1.html,转载请声明来源钻瓜专利网。





