[发明专利]一种时序数据库中快速相似搜索方法有效
| 申请号: | 202210149870.X | 申请日: | 2022-02-18 |
| 公开(公告)号: | CN114528334B | 公开(公告)日: | 2022-10-18 |
| 发明(设计)人: | 杨剑南 | 申请(专利权)人: | 重庆伏特猫科技有限公司 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
| 代理公司: | 重庆上义众和专利代理事务所(普通合伙) 50225 | 代理人: | 彭周 |
| 地址: | 400000 重庆市渝北区*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 时序 数据库 快速 相似 搜索 方法 | ||
本发明公开了一种时序数据库中快速相似搜索方法,涉及数据检索技术领域,解决了现有技术在快速检索时序数据时,工作量大,且检索相似时序数据时效率低下的技术问题;本发明获取原始数据的波形数据,根据波形数据从时序数据库中获取与其波形相似的时序数据;本发明对时序数据库进行遍历,通过波形数据对比获取相似的时序数据,既能够降低数据处理量提高效率,又能够保证搜索的精度;本发明随机选择若干个时刻获取时刻序列,根据时序函数获取对应的导数值序列,再对比导数值序列获取相似的时序数据;本发明没有将时序数据中所有时刻作为分析对象,降低了数据处理量,通过导数值之间的比对,表征两个时序函数之间变化趋势的一致性,提高搜索精度。
技术领域
本发明属于数据检索领域,涉及一种时序数据库中快速相似检索技术,具体是一种时序数据库中快速相似搜索方法。
背景技术
时序数据在当前生产活动中有着极其广泛的应用,如天气预报、股票走势和系统行为的预测和控制,因此快速获取相似的时序数据变成了时序数据处理中非常关键的步骤。
现有技术(公开号为CN113268636A的发明专利)在数据存储时,构造快速索引和全文索引,在数据检索时再根据构造的索引完成数据提取。现有技术能够提高相似时序数据的检索效率,但是在数据检索之前需要耗费较大精力,在检索相似时序数据时的作用不大。因此,亟需一种时序数据库中快速相似搜索方法。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一;为此,本发明提出了一种时序数据库中快速相似搜索方法,用于解决现有技术在快速检索时序数据时,工作量大,且检索相似时序数据时效率低下的技术问题,本发明获取原始数据的波形数据,根据波形数据从时序数据库中获取与其波形相似的时序数据,在保证搜索效率的同时还能提高搜索精度,以解决上述问题。
为实现上述目的,本发明的第一方面提供了一种时序数据库中快速相似搜索方法,包括时序数据库;
获取时序数据,并标记为原始数据;获取原始数据的波形数据;其中,波形数据通过多项式拟合法或者SDL语言获取;
根据波形数据从时序数据库中获取相似波形对应的时序数据,并标记为相似数据。
优选的,在将获取的所述时序数据标记为原始数据之前,对所述时序数据进行核验;其中,所述核验包括完整性核验和内容核验。
优选的,根据所述多项式拟合法获取时序数据的波形数据,包括:
通过多项式拟合法对时序数据进行拟合,获取对应的时序函数;其中,时序函数对应的决定系数不低于0.9;
根据时序函数获取时序数据对应的波形数据;其中,波形数据包括若干个时刻,以及对应的一阶导数值。
优选的,根据所述时序函数获取波形数据,包括:
随机选择若干个时刻,将若干个时刻按照先后顺序进行排序获取时刻序列;
获取时序函数的一阶导数,根据一阶导数分别获取时刻序列中的时刻对应的一阶导数值,生成导数值序列;
将时刻序列,以及对应的导数值序列整合生成波形数据。
优选的,根据所述波形数据搜索相似的时序数据,包括:
提取波形数据中的时刻序列;
从时序数据库中遍历选取时序数据,并标记为待验证数据;
根据时刻序列获取待验证数据对应的导数值序列;
对原始数据和待验证数据的导数值序列进行比对,根据比对结果将待验证数据标记为相似数据或者非相似数据。
优选的,对所述导数值序列进行比对,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆伏特猫科技有限公司,未经重庆伏特猫科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210149870.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于物联网的变电站可穿戴巡检系统
- 下一篇:一种超声探头快换横向手抓装置





