[发明专利]一种基于在线学习的多元时序数据规则挖掘方法在审
申请号: | 202011292898.6 | 申请日: | 2020-11-18 |
公开(公告)号: | CN112347162A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 何国良;辛欣 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 李丹 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 在线 学习 多元 时序 数据 规则 挖掘 方法 | ||
本发明公开了一种基于在线学习的多元时序数据规则挖掘方法,包括以下步骤:1)针对动态添加的多元时序数据,对各变量时间序列进行特征提取获得各变量的候选特征集,并对其分别进行聚类得到若干个簇,在每个簇中选取性能最佳的特征作为核特征,获得该变量时间序列的新数据特征集;2)对各变量的现有特征集和该变量对应的新数据特征集进行相似性查询,根据查询结果做出相应操作,获得多元时序数据的更新后的特征集;3)基于更新后的特征集进行分类规则的在线学习。本发明方法具有较好的可解释性、鲁棒性和稳定性。
技术领域
本发明涉及数据挖掘技术,尤其涉及一种基于在线学习的多元时序数据规则挖掘方法。
背景技术
近年来,在数据挖掘技术领域,多变量时间序列分类问题已经成为了一大热点,并在现实应用中引起了广泛关注,如人类活动识别、医学诊断、入侵检测、过程控制和金融预测等。由于其适用性,多变量时间序列分类在近十年内得到了充分的研究,并提出了许多批处理学习方法,分为传统的线性模型,如指数平滑模型、自回归整合移动平均模型和线性回归模型等,以及传统的非线性模型,如神经网络、支持向量机和极限学习机等。
针对多变量时间序列分类模型的批量学习问题,Guoliang He等学者提出了基于核特征早期预测多变量时间序列类别的分类方法。在该方法中,提出了一种新的核特征评估指标,从而保证了分类的准确性和早期性。Usue Mori等学者提出了一种基于概率模型的时间序列分类方法。该方法分析每个类在每个时间戳上的鉴别力,并选择满足每个类的精度都超过阈值的时间戳。
为进一步提高传统分类模型的性能,提出了许多有效的在线学习方法。例如,YuSun等学者提出了一个基于类的在线集成学习方法,该方法通过对基础学习者动态更新来快速适应数据的演化。为弥补一阶成本敏感在线学习算法的不足,Peilin Zhao等学者提出了自适应正则化成本敏感的在线梯度下降算法,该算法能够更好地权衡分类性能和时间效率之间的关系。Changsheng Li等学者提出了一个在线多输出回归方法,该方法可以在线学习回归系数的结构,从而促进分类模型的不断细化。
上述最先进的传统分类学习方法在很多现实应用上都取得了较好的效果,但是仍然存在一些局限性:
(1)对于大规模的多变量时间序列训练数据,传统分类模型学习非常耗时。此外,当新数据动态加入时,分类模型需要从零开始重新训练,这导致了极高的时间成本。
(2)随着多变量时间序列训练数据数量的增加,传统分类模型的性能提升无法达到预期的效果。
(3)由于时间序列的高维性和变量间的复杂关系,现有的在线学习方法无法有效地处理多变量时间序列。到目前为止,多元时序数据分类规则的在线学习方法的相关研究还很少。
发明内容
本发明要解决的技术问题在于针对现有技术中的缺陷,提供一种基于在线学习的多元时序数据规则挖掘方法。
本发明解决其技术问题所采用的技术方案是:一种基于在线学习的多元时序数据规则挖掘方法,包括以下步骤:
1)针对动态添加的多元时间序列数据,对各变量时间序列进行特征提取获得各变量的候选特征集,并对各变量的候选特征集分别进行聚类得到若干个簇,在每个簇中选取性能最佳的特征作为核特征,获得该变量时间序列的新数据特征集;
2)对各变量的现有特征集和该变量对应的新数据特征集进行相似性查询,根据查询结果做出相应的更新操作,获得多元时间序列数据的更新后的特征集;所述查询结果分为存在相似特征和不存在相似特征;
若新数据特征与某现有特征的查询结果为存在相似特征,则通过现有特征及新数据特征共同生成更新特征候选,然后采用基于统计量的自适应更新方法来选择现有特征或特征候选作为更新后的特征,并将更新后的特征加入更新后的特征集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011292898.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于众包模式的样本标注方法
- 下一篇:一种适用于冰场的实时监控系统