[发明专利]一种基于在线学习的多元时序数据规则挖掘方法在审
申请号: | 202011292898.6 | 申请日: | 2020-11-18 |
公开(公告)号: | CN112347162A | 公开(公告)日: | 2021-02-09 |
发明(设计)人: | 何国良;辛欣 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 李丹 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 在线 学习 多元 时序 数据 规则 挖掘 方法 | ||
1.一种基于在线学习的多元时序数据规则挖掘方法,其特征在于,包括以下步骤:
1)针对动态添加的多元时间序列数据,对各变量时间序列进行特征提取获得各变量的候选特征集,并对其分别进行聚类得到若干个簇,在每个簇中选取性能最佳的特征作为核特征,获得该变量时间序列的新数据特征集;
2)对各变量的现有特征集和该变量对应的新数据特征集进行相似性查询,根据查询结果做出相应操作,获得多元时间序列数据的更新后的特征集;所述查询结果分为存在相似特征和不存在相似特征;
若新数据特征与某现有特征的查询结果为存在相似特征,则通过现有特征及新数据特征共同生成更新特征候选,然后采用基于统计量的自适应更新方法来选择现有特征或特征候选作为更新后的特征,并将更新后的特征加入更新后的特征集;
若新数据特征与某现有特征的查询结果为不存在相似特征,基于统计量的自适应更新方法判断是否激活该新数据特征,若激活则将该新数据特征标记为更新后的特征,并将该特征加入更新后的特征集;
3)基于更新后的特征集进行分类规则的在线学习:根据步骤2)所得的更新后的特征集,更新现有规则以及挖掘新规则,获得更新后的规则集;其中,更新后的规则集中每条规则由一个或多个特征构成,但最多只包含各变量的一个特征。
2.根据权利要求1所述的基于在线学习的多元时序数据规则挖掘方法,其特征在于,所述步骤1)中对各变量时间序列进行特征提取获得各变量的候选特征集采用基于广义特征向量法分别对各变量时间序列进行特征提取。
3.根据权利要求2所述的基于在线学习的多元时序数据规则挖掘方法,其特征在于,所述步骤1)中广义特征向量法具体如下:首先,通过最大化类别i和类别j的投影数据方差的比率获得一个稀疏的、块状的特征指示向量v;然后,通过得到的特征指示向量v将相应变量的时间序列转化为特征shapelets。
4.根据权利要求1所述的基于在线学习的多元时序数据规则挖掘方法,其特征在于,所述步骤2)中相似性查询采用DTW距离计算两个特征之间的相似性。
5.根据权利要求1所述的基于在线学习的多元时序数据规则挖掘方法,其特征在于所述步骤2)中若查询结果为存在相似特征,则通过现有特征集及新数据特征集共同生成更新后的特征集为采用DBA方法平均该现有特征及其相似的新数据特征来生成更新特征。
6.根据权利要求1所述的基于在线学习的多元时序数据规则挖掘方法,其特征在于所述步骤2)中采用基于统计量的自适应更新方法来选择现有特征或特征候选作为更新后的特征为给定一个现有特征及其更新特征候选,当该候选在训练数据集中匹配的实例数大于设定统计量阈值时,判断现有特征及其更新特征候选的在线评估指标的大小,选择在线评估指标大的作为更新后的特征。
7.根据权利要求1所述的基于在线学习的多元时序数据规则挖掘方法,其特征在于,所述步骤2)中基于统计量的自适应更新方法判断是否激活该新数据特征为当该新数据特征在训练数据集中匹配的实例数大于统计量阈值时,若该新数据特征的在线评估指标满足预先指定值,则激活该新数据特征,否则,不激活该新数据特征。
8.根据权利要求1所述的基于在线学习的多元时序数据规则挖掘方法,其特征在于,所述步骤3)中所述更新现有规则具体如下:
对现有规则集中每个规则,若在该规则中存在一个或多个特征被更新,则通过替换这些特征为其更新后的特征版本,来生成更新规则候选,并采用基于统计量的自适应更新方法确定是否将该规则候选加入到现有规则集中;
所述挖掘新规则具体如下:
对新特征构成的特征集,采用关联规则方法挖掘新规则,并基于统计量的自适应更新方法判断是否激活该新规则,若激活则将该新规则加入现有规则集中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011292898.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于众包模式的样本标注方法
- 下一篇:一种适用于冰场的实时监控系统