[发明专利]更新预测模型的方法和装置在审
| 申请号: | 201410156471.1 | 申请日: | 2014-04-18 |
| 公开(公告)号: | CN105095614A | 公开(公告)日: | 2015-11-25 |
| 发明(设计)人: | 韩四儿;钟伟才;焦龙;陈栋;张婧 | 申请(专利权)人: | 国际商业机器公司 |
| 主分类号: | G06F19/00 | 分类号: | G06F19/00 |
| 代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 酆迅;李峥宇 |
| 地址: | 美国纽*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 更新 预测 模型 方法 装置 | ||
技术领域
本发明的各个实施方式涉及预测模型,更具体地,涉及更新用于时间序列数据(TimeSeriesData)的预测模型的方法和装置。
背景技术
随着计算机、数据通信以及实时监视等技术的发展,时间序列数据已经被广泛应用于例如设备监视、生产线管理、金融分析等诸多方面。时间序列数据是指按照时间顺序排列的测量值的集合,例如时间序列数据可以存储在数据库中,或者以其他方式来存储。
测量值可以包括各种数据,例如,在监视用户对在线银行系统的访问的应用环境中,被采集的测量值可以包括在各个时间点处、用户对在线银行系统的访问次数,此时的时间序列数据例如可以存储为序列x1,x2,...,xi,...,xn,并且第i个时间点处测量的数据是数值xi。在天气预报应用环境中,被采集的测量值可以是多元数据,例如可以包括温度、湿度、压力、风力,等等。此时,将获得4组时间序列数据,并且在第i个时间点处测量的数据可以是分别为temi,humi,prei和windi。
时间序列数据的数值分布通常具有一定的规律性,因而可以基于在过去的某时间段期间采集到的历史测量值来预测在未来的数据变化。例如,在上文所述的监视用户对在线银行系统的访问次数的示例中,可以基于所预测的访问次数的变化,相应地调整在线银行系统中的各种资源配置,以适合于不同时间段的用户访问需求,进而提高在线银行系统中资源利用率。
在现有技术中,已经开发出了可以基于特定时间段(例如,训练时间窗口)内的历史测量值而建立预测模型,进而预测在未来的特定时间段(例如,预测时间窗口)内的数值的技术方案。然而,预测模型通常会随着时间的推移而变化,按照现有的技术方案,无法知晓现有的预测模型与真实测量值相匹配或者不相匹配,因而只能随着时间的推移而频繁地更新预测模型,这产生了极大的计算量。一方面,现有技术并不提供应当在何时更新预测模型进而生成新的预测模型的通知;另一方面,由于更新后的新的预测模型将依赖于历史数据的选取,因而如何从大量历史数据中选择适当的范围用于生成新的预测模型,也成为一个关注的焦点。
发明内容
因而,期望开发一种能够有效地更新用于时间序列数据的预测模型的技术方案,期望该技术方案可以检测现有的预测模型是否能够较为准确地反映时间序列数据在未来的变化(例如,判断预测值和实际测量值之间的误差是否在特定阈值范围内),进而在误差超过预定阈值时,能够提供更新预测模型的通知。
根据本发明的一个方面,提供了一种用于更新预测模型的方法,该预测模型是用于时间序列数据的预测模型,包括:从与预测模型相关联的多个预测时间窗口中按顺序选择当前预测时间窗口h;基于预测模型,预测时间序列数据在当前预测时间窗口h内的各个时间点k的预测值基于时间序列数据在当前预测时间窗口h内的各个时间点k的实际测量值yk和预测值计算与当前预测时间窗口h相关联的预测误差MAPE;以及响应于预测误差MAPE大于或等于与当前预测时间窗口h相关联的预定误差阈值,提供更新预测模型的通知。
根据本发明的一个方面,提供了一种更新预测模型的方法,该预测模型是用于时间序列数据的预测模型,包括:响应于接收到更新预测模型的通知,获取与通知相关联的当前预测时间窗口h和与所述预测模型相关联的当前训练时间窗口,其中通知是根据上文的方法来提供的;计算与当前训练时间窗口和当前预测时间窗口h相关联的总累积误差ACCh;提取时间点的范围,使得时间序列数据在范围内的实际测量值与预测值之间的累积误差ACCw′和总累积误差ACCh之间的比例大于或等于预定比例;以及提供时间点的范围作为更新预测模型的新的训练时间窗口。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410156471.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种光纤传感振动信号的识别方法
- 下一篇:一种模拟高层建筑火灾的方法
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用





