[发明专利]一种时间序列的分类方法及装置在审
| 申请号: | 201510097947.3 | 申请日: | 2015-03-05 |
| 公开(公告)号: | CN104657749A | 公开(公告)日: | 2015-05-27 |
| 发明(设计)人: | 张莉;陶志伟;王邦军;张召;李凡长;杨季文 | 申请(专利权)人: | 苏州大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 常亮 |
| 地址: | 215123 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 时间 序列 分类 方法 装置 | ||
技术领域
本发明涉及数据挖掘领域,尤其涉及一种时间序列的分类方法及装置。
背景技术
时间序列的分类问题一直是数据挖掘领域研究人员关注的重点。时间序列是某种现象或统计指标在不同时间段内、按照时间顺序排列而成的有序序列。随着大数据时代的到来,快速有效地对杂乱无章的时间序列的分类显得尤为重要。
发明内容
本发明提供了一种时间序列的分类方法及装置,本申请能够快速有效地对杂乱无章的时间序列进行分类。
为了实现上述目的,本发明提供了下述技术手段:
一种时间序列的分类方法,包括:
将一测试时间序列按时间顺序分为若干个测试时间子序列,生成测试时间子序列集;
逐个计算所述测试时间子序列集与多个预设类别码本之间的欧式距离;
将最小欧式距离对应预设类别码本的类别赋予所述测试时间序列;
其中,每个预设类别码本为对每个训练类别子集执行K均值聚类算法后生成K个聚类中心的集合,所述每个训练类别子集为对每个训练时间序列子集中每个训练时间序列按时间顺序分段后形成多个训练时间分段序列的集合,所述每个训练时间序列子集为按类别标签对训练时间序列集合分类后生成的、仅包含一个类别标签训练时间序列的集合,训练时间序列集合中包括若干个已知类别标签的训练时间序列。
优选的,预先构建多个预设类别码本的过程包括:
获得训练时间序列集合,其中所述训练时间序列集合中包括若干个已知类别标签的训练时间序列;
按类别标签对所述训练时间序列集合分类、生成与类别标签一一对应的多个训练时间序列子集,其中,每个训练时间序列子集中仅包含一个类别标签的至少一个训练时间序列;
对每个训练时间序列子集中每个训练时间序列按时间顺序分段形成多个训练时间分段序列,将该训练时间序列子集中与每个训练时间序列对应的多个训练时间分段序列的集合、作为该训练时间序列子集对应类别的训练类别子集;
对每个训练类别子集执行K均值聚类算法生成K个聚类中心,将K个聚类中心的集合作为训练类别子集对应的码本,将每个训练类别子集对应的码本作为多个预设类别码本,其中,码本由K个码词组成,每个聚类中心对应一个码词。
一种时间序列的分类方法,包括:
将一测试时间序列按时间顺序分为若干个测试时间子序列,生成测试时间子序列集;
对所述测试时间子序列集采用K均值聚类算法生成K个聚类中心,将所述K个聚类中心的集合作为所述测试时间序列的测试码本;
逐个计算所述测试码本与多个预设类别码本之间的欧式距离;
将最小欧式距离对应预设类别码本的类别赋予所述测试时间序列;
其中,每个预设类别码本为对每个训练类别子集执行K均值聚类算法后生成K个聚类中心的集合,所述每个训练类别子集为对每个训练时间序列子集中每个训练时间序列按时间顺序分段后形成多个训练时间分段序列的集合,所述每个训练时间序列子集为按类别标签对训练时间序列集合分类后生成的、仅包含一个类别标签训练时间序列的集合,训练时间序列集合中包括若干个已知类别标签的训练时间序列。
优选的,预先构建多个预设类别码本的过程包括:
获得训练时间序列集合,其中所述训练时间序列集合中包括若干个已知类别标签的训练时间序列;
按类别标签对所述训练时间序列集合分类、生成与类别标签一一对应的多个训练时间序列子集,其中,每个训练时间序列子集中仅包含一个类别标签的至少一个训练时间序列;
对每个训练时间序列子集中每个训练时间序列按时间顺序分段形成多个训练时间分段序列,将该训练时间序列子集中与每个训练时间序列对应的多个训练时间分段序列的集合、作为该训练时间序列子集对应类别的训练类别子集;
对每个训练类别子集执行K均值聚类算法生成K个聚类中心,将K个聚类中心的集合作为训练类别子集对应的码本,将每个训练类别子集对应的码本作为多个预设类别码本,其中,码本由K个码词组成,每个聚类中心对应一个码词。
一种时间序列的分类方法,包括:
将一测试时间序列按时间分为若干个测试时间子序列,生成测试时间子序列集;
在一个预设类别码本中为每个测试时间子序列选择一个对应的码词,将每个测试时间子序列对应的码词组成所述测试时间序列的一个重构测试时间序列,该重构测试时间序列的类别与该预设类别码本的类别一致,按上述构建重构测试时间序列的方式构建所述测试时间序列与所有预设类别码本一一对应的多个重构测试时间序列;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学;,未经苏州大学;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510097947.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一次性防盗电子钢丝封
- 下一篇:基于HU不变矩实现车标自动识别的方法





