[发明专利]时间序列数据处理方法、装置和计算机可读存储介质在审
| 申请号: | 201911365065.5 | 申请日: | 2019-12-26 |
| 公开(公告)号: | CN113051442A | 公开(公告)日: | 2021-06-29 |
| 发明(设计)人: | 郑佳欢;张慧嫦;李力卡;王敏;张海平;陈康;向勇;陈翀;刘春;付华峥 | 申请(专利权)人: | 中国电信股份有限公司 |
| 主分类号: | G06F16/903 | 分类号: | G06F16/903;G06F16/904;G06F16/906 |
| 代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 曹蓓 |
| 地址: | 100033 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 时间 序列 数据处理 方法 装置 计算机 可读 存储 介质 | ||
1.一种时间序列数据处理方法,包括:
将时间序列数据做图形化处理,获取时间序列曲线;
根据时间序列曲线的图形化特征对所述时间序列数据做预定粒度的划分,获取多组初分类时间序列数据,其中,每组所述初分类时间序列数据中包括一条或多条所述时间序列数据;
通过聚类算法处理每组所述初分类时间序列数据,获取聚类时间序列数据簇;
根据所述聚类时间序列数据簇执行数据存储或挖掘中的至少一项。
2.根据权利要求1所述的方法,其中,所述根据时间序列数据做图形化处理,获取时间序列曲线包括:
基于清洗后的根据时间序列数据做归一化处理;
根据归一化处理后的所述时间序列数据按照时间顺序绘制曲线;
将绘制后的曲线并做平滑化处理,获取所述时间序列曲线。
3.根据权利要求1所述的方法,其中,所述通过聚类算法处理每组所述初分类时间序列数据,获取聚类时间序列数据包括:
针对每组所述初分类时间序列数据,以对应的所述时间序列曲线为处理单位:
基于全局约束的动态时间归整DTW算法获取所述时间序列曲线间的距离相似度矩阵;
根据所述距离相似度矩阵,基于改进的AP算法做聚类运算,获取聚类时间序列数据。
4.根据权利要求3所述的方法,其中,所述根据所述距离相似度矩阵,基于改进的AP算法做聚类运算,获取聚类时间序列数据包括:
设置偏向参数;
基于AP算法,更新吸引信息矩阵和归属信息矩阵,确定当前偏向参数下的聚类结果;
基于预定策略修改偏向聚类参数,确定修改后的当前偏向参数下的聚类结果,直至获取全部偏向参数下的聚类结果;
获取每个偏向参数下的聚类结果的轮廓系数;
获取所述轮廓系数最大的聚类结果对应的聚类时间序列数据簇。
5.根据权利要求4所述的方法,其中,所述偏向参数包括相似度值的中值和所述中值的多个分位数。
6.根据权利要求4所述的方法,其中,所述轮廓系数s(i)为:
其中,i为所述时间序列数据样本标识,a(i)为簇内不相似度,b(i)为簇间不相似度。
7.根据权利要求1所述的方法,其中,所述时间序列数据为随时间的先后次序改变的数据,包括流量数据、潮汐数据、语音数据、波动数据或心电图数据中的一种或多种。
8.根据权利要求1所述的方法,其中,所述图形化特征包括有效波峰的数量和/或振幅。
9.一种时间序列数据处理装置,包括:
预处理单元,被配置为将时间序列数据做图形化处理,获取时间序列曲线;
初分类单元,被配置为根据时间序列曲线的图形化特征,对所述时间序列数据做预定粒度的划分,获取多组初分类时间序列数据,其中,每组所述初分类时间序列数据中包括一条或多条所述时间序列数据;
聚类单元,被配置为通过聚类算法处理每组所述初分类时间序列数据,获取聚类时间序列数据簇;
下游任务单元,被配置为根据所述聚类时间序列数据簇执行数据存储或挖掘中的至少一项。
10.一种时间序列数据处理装置,包括:
存储器;以及
耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器的指令执行如权利要求1至8任一项所述的方法。
11.一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现权利要求1至8任意一项所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911365065.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:印台用、红印泥用或渗透印用的油性油墨
- 下一篇:一种新型的重楼中药材加工机





