[发明专利]一种时间序列的检索方法、装置及系统有效
申请号: | 201610527552.7 | 申请日: | 2016-07-06 |
公开(公告)号: | CN107590143B | 公开(公告)日: | 2020-04-03 |
发明(设计)人: | 莫增文 | 申请(专利权)人: | 北京金山云网络技术有限公司;北京金山云科技有限公司 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;项京 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 时间 序列 检索 方法 装置 系统 | ||
本发明实施例公开了一种时间序列的检索方法、装置及系统,应用本发明实施例,在海量数据中检索目标时间序列的相似时间序列时,先对海量数据进行过滤处理,滤除很大一部分时间序列,再针对未被滤除的剩余时间序列,计算剩余时间序列中的节点数据与其对应的目标时间序列中节点数据的距离,并判断该距离是否满足预设规则,如果是,则将该剩余时间序列确定为检索结果。由此可见,相比于针对海量数据进行相似性运算的方案,减少了时间成本,提高了检索效率。
技术领域
本发明涉及数据分析技术领域,特别涉及一种时间序列的检索方法、装置及系统。
背景技术
时间序列是指将某种现象某一个统计指标在不同时间上的各个数值,按时间先后顺序排列而形成的序列,其中各个数值即为时间序列的各个节点数据。时间序列分析(Timeseries analysis)是一种动态数据处理的统计方法,研究随机时间序列所遵从的统计规律,在统计学中作为一种常用的预测手段被广泛应用。
时间序列为典型的高维海量数据,如何从高维海量的时间序列数据流中,检索到目标时间序列的相似时间序列,是目前被广泛研究的问题。通常的检索方法是,将目标时间序列与所有的时间序列逐一进行相似性运算,将最相似的一个或多个时间序列作为检索的结果。
然而,由于时间序列是高维海量数据,针对海量数据进行相似性运算,必然需要占用大量的时间,导致检索效率不高。
发明内容
本发明实施例的目的在于提供一种时间序列的检索方法、装置及系统,以提高检索效率。
为达到上述目的,本发明实施例公开了一种时间序列的检索方法,包括:
获取待检索的目标时间序列;
获取用于检索的数据段中的候选时间序列;
按照预设过滤算法,计算每个候选时间序列与所述目标时间序列之间的边界距离;
滤除所述与所述目标时间序列之间的边界距离不满足第一预设规则的候选时间序列,获得剩余候选时间序列;
计算所述目标时间序列中的节点数据与每个所述剩余候选时间序列中节点数据的节点距离,并判断所述节点距离是否满足第二预设规则;
将节点距离满足第二预设规则的剩余候选时间序列确定为检索到的相似时间序列。
可选的,所述获取用于检索的数据段中所有的候选时间序列,可以包括:
对用于检索的数据流进行分段,得到多个数据段;
从所述多个数据段中,获取候选时间序列。
可选的,所述目标时间序列中包括第一数量个节点数据;
所述从所述多个数据段中,获取候选时间序列,可以包括:
针对每个数据段,从所述数据段中获取预设第二数量个节点数据,将所述第二数量个节点数据组合为循环队列,其中,所述第二数量大于所述第一数量;
按照第一预设顺序,在所述循环队列中获取所述第一数量个节点数据,将所获取的节点数据按照所述第一预设顺序组合为候选时间序列;
将所述循环队列队头位置的预设第三数量个节点数据删除;
从所述数据段中获取所述第三数量个节点数据补充到所述队头位置,形成新的循环队列,并继续执行所述按照第一预设顺序,在所述循环队列中获取所述第一数量个节点数据,将所获取的节点数据按照所述第一预设顺序组合为候选时间序列的步骤。
可选的,在所述获取用于检索的数据段中的候选时间序列之后,还可以包括:
利用预设标准化算法,对所述目标时间序列及所述候选时间序列进行标准化处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京金山云网络技术有限公司;北京金山云科技有限公司,未经北京金山云网络技术有限公司;北京金山云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610527552.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种输送稳定均匀的茶叶风选装置
- 下一篇:一种清杂分级粮食振动筛