[发明专利]一种基于多元变量间的关系变化的时序分类的方法有效
| 申请号: | 201910833290.0 | 申请日: | 2019-09-04 |
| 公开(公告)号: | CN110751169B | 公开(公告)日: | 2023-09-29 |
| 发明(设计)人: | 蔡瑞初;陈嘉伟;温雯;郝志峰;陈炳丰;李梓健 | 申请(专利权)人: | 广东工业大学 |
| 主分类号: | G06F18/24 | 分类号: | G06F18/24;G06N3/0442;G06N3/0464;G06N3/08 |
| 代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
| 地址: | 511404 广东省*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 多元 变量 关系 变化 时序 分类 方法 | ||
本发明提供的一种基于多元变量间的关系变化的时序分类的方法,包括:从观察数据集中获取样本数据,计算样本数据两两变量间的偏相关系数,构造偏相关系数矩阵;通过卷积神经网络对偏相关系数矩阵进行编码后得到对应的特征图;将每个特征图分别拉伸成特征向量循环输入长短记忆神经网络,从而得到用于捕获变量关系间变化模式的隐藏状态;将隐藏状态输入标签分类器,输出对应的样本类别,完成时序的分类。本发明提供的一种基于多元变量间的关系变化的时序分类的方法,充分地考虑了时序数据中不同变量之间的关系,同时基于变量的关系模式进行分类,充分地表达了时序数据中不同变量关系的变化模式,同时对输入的噪声值具有更好的鲁棒性,分类精度高。
技术领域
本发明涉及数据挖掘技术领域,更具体的,涉及一种基于多元变量间的关系变化的时序分类的方法。
背景技术
如今,时序数据在工业系统,信息系统,医疗健康,金融市场等领域的应用变得越来越普遍。因此,时间序列的分类任务已经成为一个重要且有价值的研究课题,如异常检测等。传统的基于相似度的时序分类方法,如K-近邻(KNN)和动态时间规整(DTW)等。然而这类方法只对变量的数值敏感,并未考虑不同变量之间的关系。
目前流行的另一类方法是对时序数据的进行一系列的特征变换,从而挖掘其中的模式用于分类,如多层感知器(MLP)、长短期记忆神经网络(LSTM)和卷积神经网络(CNN)等。这类方法虽然在特征空间上隐式地对不同变量之间的关系进行捕获,但是难以刻画变量之间关系的变化模式。在时间序列分类问题上,变量之间关系的某类变化方式往往代表着一种分类的类别。例如,在信息系统中,一般情况下某个服务器的“CPU使用率”上升会导致“CPU温度”上升,而“CPU温度”上升导致“风扇转速”上升,从而在“CPU使用率”继续上升时维持“CPU温度”相对稳定。可以看出,这段时间内“CPU使用率”和“CPU温度”的关系从不独立变成独立。然而当服务器的风扇发生故障时,那么“CPU温度”和“风扇转速”两者可能无关,“CPU使用率”上升导致“CPU温度”持续上升,甚至导致服务器宕机。因此,这段时间“CPU使用率”和“CPU温度”的关系一直是不独立的。
上述两个类别中,变量之间关系的变化方式是不一样的,然而目前的方法无法很好的对这种变化进行表达并分类。
发明内容
本发明为克服现有的时序数据分类方法存在无法有效地对变量之间关系的变化方式进行表达并人类的技术缺陷,提供了一种基于多元变量间的关系变化的时序分类的方法。
为解决上述技术问题,本发明的技术方案如下:
一种基于多元变量间的关系变化的时序分类的方法,包括以下步骤:
S1:获取带标签的观察数据集;
S2:从观察数据集中获取样本数据,计算样本数据两两变量间的偏相关系数,构造偏相关系数矩阵,得到每个时刻的偏相关系数矩阵;
S3:将每个时刻的偏相关系数矩阵作为输入卷积神经网络CNN,由卷积神经网络对偏相关系数矩阵进行编码后得到对应的特征图;
S4:将每个特征图分别拉伸成特征向量循环输入长短记忆神经网络LSTM,从而得到用于捕获变量关系间变化模式的隐藏状态;
S5:将隐藏状态输入标签分类器,输出对应的样本类别,完成时序的分类。
其中,所述步骤S1具体为:
利用工业系统或者信息系统的数据采集装置固定时间进行采样;每个采样时刻获得不同的指标值,同时将该时刻对应的系统状态用标签变量表示,系统运行一段时间后即可采集到观察数据集,其中:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910833290.0/2.html,转载请声明来源钻瓜专利网。





