[发明专利]基于时序分割和聚类的工业物联网高频数据压缩方法在审
| 申请号: | 202211041442.1 | 申请日: | 2022-08-29 |
| 公开(公告)号: | CN115459782A | 公开(公告)日: | 2022-12-09 |
| 发明(设计)人: | 牛晓东;肖红彬;石振锋;崔鲲 | 申请(专利权)人: | 北京思维实创科技有限公司 |
| 主分类号: | H03M7/40 | 分类号: | H03M7/40;G06K9/62;G06N3/00 |
| 代理公司: | 哈尔滨市阳光惠远知识产权代理有限公司 23211 | 代理人: | 陈晶 |
| 地址: | 100026 北京市朝*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 时序 分割 工业 联网 高频 数据压缩 方法 | ||
本发明公开了一种基于时序分割和聚类的工业物联网高频数据压缩方法,属于时间序列压缩技术领域,其包括:使用基于改进象群优化算法的高斯分割模型对时间序列划分,得到多个片段;使用基于改进峰值密度初始化的高斯混合模型对其进行聚类,得到分模块方差和聚类标签;根据方差所占比例对每个聚类中心再次等距分割;利用SAX方法将每类中心的每段均值转化为符号表示,每类第一个字符为大写字母;对同一类相同符号表示剪切,保留第一个大写字母,得到时间序列值压缩数据;获取时间戳和分割点信息,采用DPCM算法对其压缩;使用Huffman编码对聚类标签符号化压缩。该方法可以使得工业物联网数据得到更低的压缩率以及更好的数据还原能力。
技术领域
本发明涉及时间序列压缩技术领域,特别涉及一种基于时序分割和聚类的工业物联网高频数据压缩方法及装置、以及解压缩方法及装置。
背景技术
时间序列压缩是时间序列相关研究中的一项重要研究。由于科技发展迅速,智能化渗入到生产、制造、监测等工作的方方面面,一个公司、一个平台或一个系统每时每刻都需要产生数据,产生的这些数据不仅所需要的数据采集装置基数大,而且采集的频率高,数据类型复杂多样,数据前后还具有一定的相关性。因此需要高效的压缩方法来实现对于时间序列数据的存储。
时间序列的压缩方法有相对成熟的研究成果,也有在不断更新的研究成果。包括无损的压缩模型以及有损的压缩模型。大多数时间序列的压缩方法都集中在有损压缩方面。其中,序列的表示方法是主要手段,包括离散傅立叶变换、离散小波变换、奇异值分解、分段线性表示和符号化方法等。
Keogh等人为解决大的时间序列数据库的相似性搜索问题,引入了一种新的降维技术,即分段累积近似法(PiecewiseAffregateApproximation,PAA)。在此基础上又产生了很多发展和改进,包括适应性分段常数近似法(AdaptivePiecewiseConstantApproximation,APCA)值得一提的是符号聚合近似(Symbolic Aggregate Approximation,SAX)方法,该方法在PAA方法的基础上,引入了高斯分布的等概率区间的划分以及符号转化,这种离散化方法为数据表示以及压缩提供了新的方向。SAX属于符号化方法的范畴,具有简单、快速、应用范围广等特点,但是也存在着一定的缺陷;并且,也很少有以时间序列前后存在的相关性为切入点来建立压缩模型的方法,进而对于工业物联网数据的压缩更是少之又少。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种基于时序分割和聚类的工业物联网高频数据压缩方法,该方法可以得到更低的压缩率以及更好的数据还原能力。
本发明的第二个目的在于提出一种基于时序分割和聚类的工业物联网高频数据压缩装置。
本发明的第三个目的在于提出一种基于时序分割和聚类的工业物联网高频数据解压缩方法。
本发明的第四个目的在于提出一种基于时序分割和聚类的工业物联网高频数据解压缩装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京思维实创科技有限公司,未经北京思维实创科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211041442.1/2.html,转载请声明来源钻瓜专利网。





