[发明专利]一种基于稀疏时间序列数据的事件发生时间预测方法在审
申请号: | 202111576670.4 | 申请日: | 2021-12-22 |
公开(公告)号: | CN114239743A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 付波;刘术辉 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06V10/764;G06N20/00 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 邹裕蓉 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 稀疏 时间 序列 数据 事件 发生 预测 方法 | ||
本发明公开了一种基于稀疏时间序列数据的事件发生时间预测方法,分为统计特征选择和模型训练测试两个步骤依次实施,统计特征选择是采用单因素分析的方法,通过统计检验初步选择出有显著差异的特征;模型训练测试是使用筛选完成的特征构造新的时间序列特征并使用梯度提升树进行训练。本发明简化了特征构造方式,有效解决了时序数据的特征构造在不同的数据系统中存在较大差异无法通用的问题,同时预测精度相比于其他的方法提升明显。
技术领域
本发明涉及机器学习技术,特别涉及基于时间序列数据的事件预测技术。
背景技术
时间序列数据是一串按时间维度索引的数据,这类数据描述了某个被测量的主体在一个时间范围内的每个时间点上的测量值。对时序数据通常会包含三个部分,分别是:主体,时间点和测量值。稀疏表示的目的就是在给定的超完备字典中用尽可能少的原子来表示信息,可以获得信息更为简洁的表示方式,从而使我们更容易地获取信号中所蕴含的信息,更方便进一步对信号进行加工处理。基于稀疏时间序列数据的事件发生时间预测,用于根据稀疏表示的时间序列数据来预测某个时间在指定时间是否发生,该应用在生活中无处不在,从对自然环境、人体行为或者身体机能各方面的事件的判断上,比如天气预报与各种预警系统。
机器学习在时序数据预测上有很多的成果,在这方面应用最广泛的是循环神经网络。但是循环神经网络对数据的要求较高,需要数据是连续且不能存在空值,而且现有的循环神经网络模型都存在特异度较高而灵敏度较低的问题。其他还有随机森林和梯度提升树等模型,虽然模型的精度较高,但是无法处理时间序列数据,或者需要根据数据本身的特点手动构造,在不同的时间序列数据中无法通用,处理过程非常繁琐。
发明内容
本发明所要解决的技术问题是,提供一种自动构造基于时间序列数据的特征来进行事件是否发生的预测方法。
本发明为解决上述技术问题所采用的技术方案是,一种基于稀疏时间序列数据的事件预测方法,包括:
S1.对稀疏时间序列数据进行数据分类,将在观测时间长度内未发生变换的作为静态数据,持续随时间变化的作为动态数据,间断出现且只有0与1两种状态的作为离散数据;
S2.按数据类别进行特征提取:
对于静态数据,选取与事件相关的特征作为静态数据特征;
对于动态数据,先按事件是否发生进行分组,再对各动态数据提取数据特征,再计算数据特征的置信度,再按保留置信度小于0.1的数据特征的方式进行筛选;筛选后的数据特征作为原始动态特征,再将原始动态特征对应时间点之前的一段时间的数据特征作时序特征,原始动态特征和其对应的时序特征合并为最终的动态数据特征;
对于离散数据,先对离散数据进行独热编码作为离散数据的原始离散特征,再对每个原始特征统计在对应时间点之前的原始特征出现次数作为计数特征,原始离散特征和其对应的计数特征合并为最终的离散数据特征;
S3.将同一时间点的静态数据特征、时间特征序列和离散数据特征进行拼接形成模型的输入特征,再按照事件是否发生进行贴标后形成训练数据;将观测时间内的训练数据形成训练集输入至事件发生预测模型中进行训练;
S4.将待预测的稀疏时间序列数据通过S1-S2步骤,将同一时间点的静态数据特征、时间特征序列和离散数据特征进行拼接形成模型的输入特征输入至训练完成的事件发生预测模型中,事件发生预测模型输出对应时间点是否发生事件的预测结果。
进一步的,事件发生预测模型由多个子模型组成,在事件发生预测模型训练过程中,使用多折交叉验证方法将训练集输入多个子模型训练,采用自定义评价函数和贝叶斯超参数优化训练子模型,并使用多个子模型输出的均值作为最后的预测值;
本发明方法运用统计特征筛选,以简单时间相关来构造特征。本发明的有益效果是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111576670.4/2.html,转载请声明来源钻瓜专利网。