[发明专利]一种基于稀疏时间序列数据的事件发生时间预测方法在审
申请号: | 202111576670.4 | 申请日: | 2021-12-22 |
公开(公告)号: | CN114239743A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 付波;刘术辉 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06V10/764;G06N20/00 |
代理公司: | 电子科技大学专利中心 51203 | 代理人: | 邹裕蓉 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 稀疏 时间 序列 数据 事件 发生 预测 方法 | ||
1.一种基于稀疏时间序列数据的事件发生时间预测方法,其特征在于:
S1.对稀疏时间序列数据进行数据分类,将在观测时间长度内未发生变换的作为静态数据,持续随时间变化的作为动态数据,间断出现且只有0与1两种状态的作为离散数据;
S2.按数据类别进行特征提取:
对于静态数据,选取与事件相关的特征作为静态数据特征;
对于动态数据,先按事件是否发生进行分组,再对各动态数据提取数据特征,再计算数据特征的置信度,再按保留置信度小于0.1的数据特征的方式进行筛选;筛选后的数据特征作为原始动态特征,再将原始动态特征对应时间点之前的一段时间的数据特征作时序特征,原始动态特征和其对应的时序特征合并为最终的动态数据特征;
对于离散数据,先对离散数据进行独热编码作为离散数据的原始离散特征,再对每个原始特征统计在对应时间点之前的原始特征出现次数作为计数特征,原始离散特征和其对应的计数特征合并为最终的离散数据特征;
S3.将同一时间点的静态数据特征、时间特征序列和离散数据特征进行拼接形成模型的输入特征,再按照事件是否发生进行贴标后形成训练数据;将观测时间内的训练数据形成训练集输入至事件发生预测模型中进行训练;
S4.将待预测的稀疏时间序列数据通过S1-S2步骤,将同一时间点的静态数据特征、时间特征序列和离散数据特征进行拼接形成模型的输入特征输入至训练完成的事件发生预测模型中,事件发生预测模型输出对应时间点是否发生事件的预测结果。
2.如权利要求1方法,其特征在于,计算数据特征的置信度之前,先判断特征是否属于无法使用数字进行量化或者观测次数少于总事件发生次数的情况,如是,则丢弃该数据特征,否则再计算该算数据特征的置信度。
3.如权利要求1方法,其特征在于,计算数据特征的置信度的具体方式为:对于每一个数据特征使用KS检验该数据特征的分布是否服从正态分布,如是则使用独立样本的T检验计算置信度,否则使用Mann-Whitney U检验计算置信度。
4.如权利要求1方法,其特征在于,原始动态特征Fi(t)对应的时序特征为:Fi(t-2),Fi(t-4),Fi(t)-Fi(t-1),Fi(t-1)-Fi(t-3),t为当前时间点。
5.如权利要求1方法,其特征在于,事件发生预测模型由多个子模型组成,在事件发生预测模型训练过程中,使用多折交叉验证方法将训练集输入多个子模型训练,并使用多个子模型输出的均值作为最后的预测值。
6.如权利要求5方法,其特征在于,在事件发生预测模型训练过程中,采用自定义评价函数和贝叶斯超参数优化训练子模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111576670.4/1.html,转载请声明来源钻瓜专利网。