[发明专利]大数据量预测的三层联合动态选择最优模型方法有效
申请号: | 201610638099.7 | 申请日: | 2016-08-04 |
公开(公告)号: | CN106257506B | 公开(公告)日: | 2018-02-13 |
发明(设计)人: | 吴冬华;胡曼恬;胡岳;闫兴秀 | 申请(专利权)人: | 南京华苏科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 江苏纵联律师事务所32253 | 代理人: | 戴勇 |
地址: | 210000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据量 预测 三层 联合 动态 选择 最优 模型 方法 | ||
1.一种大数据量预测的三层联合动态选择最优模型方法,其特征在于:包括预测模型算法库、权重算法库、最优权重算法甄选算法三层,预测模型算法库放置在最底层,在预测模型算法库之上是权重算法库,在权重算法库之上是最优权重算法甄选算法;
预测模型算法库:包含若干种预测模型算法,这些算法被抽象成共同的接口,放置在联合算法的最底层,提供预测功能,支撑更上层的功能;
权重算法库:对预测模型算法库的最底层算法的多样性进行屏蔽,根据底层算法的预测结果,按若干种标准对底层算法进行甄选组合,形成若干种权重算法;
最优权重算法甄选算法:根据验证集中权重算法的效果,选择最优的权重算法,进行预测;
预测模型算法库具体的实现步骤如下:
输入训练数据;对训练数据预处理后,得到待用数据;
使用两种以上的不同算法对待用数据进行模型拟合,得到各待选模型;
对训练数据预处理,具体包括:
数据筛选:去除过于稀疏的数据列;
时间格式的处理:将时间列映射为连续的整数;
数据补值:缺失数据插值、错误数据插值;
权重算法采用如下算法:
算法一:给予所有预测模型相同的权重;
算法二:剔除百分之二十预测结果相对较差的模型,并给予剩下的模型相同的权重;
算法三:计算各模型误差均方根,然后根据误差均方根大小,设计一个反趋势的函数,并根据该函数给各模型赋予权重;
算法四:计算各模型最小绝对误差,然后根据最小绝对误差大小,设计一个反趋势的函数,并根据该函数给各模型赋予权重;
算法五:计算各模型最小二乘计算的误差,然后根据最小二乘计算的误差大小,设计一个反趋势的函数,并根据该函数给各模型赋予权重;
算法六:计算各模型赤池信息量准则,然后根据赤池信息量准则大小,设计一个反趋势的函数,并根据该函数给各模型赋予权重。
2.如权利要求1所述的大数据量预测的三层联合动态选择最优模型方法,其特征在于,预测模型算法库具体的实现步骤如下:
调用预测模型库,得到预测模型的预测数据集;
分别调用各个权重算法,并计算权重;
赋予各预测模型相应权重,进行数据预测,存储预测的数据。
3.如权利要求1所述的大数据量预测的三层联合动态选择最优模型方法,其特征在于,最优权重算法依据各权重算法在测试集上的预测效果,来甄选最优权重算法;最优权重算法甄选算法的具体步骤如下:
调用权重算法库的算法,得到权重预测的数据的集合;
利用权重库预测的数据集,与验证集比对,得到误差;
由最小误差,得到最优权重算法;
将最优权重方法预测的数据存储,得到预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京华苏科技有限公司,未经南京华苏科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610638099.7/1.html,转载请声明来源钻瓜专利网。