[发明专利]时序相似性查询和时序存储的方法、装置、介质及设备在审
| 申请号: | 202111022473.8 | 申请日: | 2021-09-01 |
| 公开(公告)号: | CN113742398A | 公开(公告)日: | 2021-12-03 |
| 发明(设计)人: | 俞自生;李瑞远 | 申请(专利权)人: | 京东城市(北京)数字科技有限公司 |
| 主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/9535;G06Q40/04 |
| 代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 李永叶 |
| 地址: | 100086 北京市海淀区知*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 时序 相似性 查询 存储 方法 装置 介质 设备 | ||
1.一种时序相似性查询方法,其特征在于,包括:
参数确定步骤,确定查询时序的近邻距离参数,并将所述查询时序按照预定周期划分为多个查询子时序;
时序剪枝步骤,根据所述近邻距离参数和各查询子时序的极值确定各查询子时序的剪枝阈值,根据所述各查询子时序的剪枝阈值对各查询子时序进行剪枝处理;
候选确定步骤,将待查询的时序数据集中落入各查询子时序的经过剪枝处理后的区域内的时序确定为候选子时序,并将隶属于时序数据集中同一时序的候选子时序合并为候选时序;
查询选取步骤,计算各候选时序与所述查询时序之间的第一相似度,并按照所述第一相似度从高到低的顺序选取目标数量的候选时序作为时序相似性查询结果。
2.根据权利要求1所述的方法,其特征在于,在所述参数确定步骤中,所述确定查询时序的近邻距离参数,包括:
获取查询时序和待查询的时序数据集,并确定目标数量和采样率;
根据所述采样率,对所述时序数据集中的时序进行采样,将采样后的时序确定为样本时序;
根据所述目标数量和所述采样率,确定近邻样本数量;
计算各样本时序与所述查询时序之间的第二相似度,并按照所述第二相似度从高到低的顺序依次选取所述近邻样本数量的样本时序作为近邻样本时序;
确定所述近邻样本时序中与最低的第二相似度对应的近邻样本时序,并将与该近邻样本时序对应的第二相似度确定为所述查询时序的近邻距离参数。
3.根据权利要求2所述的方法,其特征在于,所述近邻样本数量ksample通过来确定,其中,k是所述目标数量,α是所述采样率。
4.根据权利要求1所述的方法,其特征在于,在所述候选确定步骤之后且在所述查询选取步骤之前,所述方法还包括:
判断所述候选时序的数量是否小于所述目标数量;
当所述候选时序的数量小于所述目标数量时,计算各候选时序与所述查询时序之间的第一相似度,并确定与最低的第一相似度对应的候选时序,将与该候选时序对应的第一相似度确定为所述查询时序的近邻距离参数;
根据重新确定的所述查询时序的近邻距离参数,重新执行所述时序剪枝步骤和所述候选确定步骤,直至所述候选时序的数量大于等于所述目标数量。
5.根据权利要求1所述的方法,其特征在于,
所述时序剪枝步骤包括:
对于每个查询子时序,根据该查询子时序的极小值和所述近邻距离参数,确定该查询子时序的第一剪枝阈值,根据该查询子时序的极大值和所述近邻距离参数,确定该查询子时序的第二剪枝阈值,其中,所述第一剪枝阈值小于所述第二剪枝阈值;
将所述第一剪枝阈值和所述第二剪枝阈值之间的区域确定为经过剪枝处理后要保留的候选区域,或者将小于所述第二剪枝阈值的区域确定为经过剪枝处理后要保留的候选区域;
所述候选确定步骤包括:
将待查询的时序数据集中落入相应的候选区域的时序确定为候选子时序,将候选子时序中隶属于时序数据集中同一时序的候选子时序合并为候选时序。
6.根据权利要求5所述的方法,其特征在于,将每个查询子时序的极小值与所述近邻距离参数之差确定为该查询子时序的第一剪枝阈值,将每个查询子时序的极大值与所述近邻距离参数之和确定为该查询子时序的第二剪枝阈值。
7.根据权利要求1至5任一项所述的方法,其特征在于,各相似度通过计算切比雪夫距离来确定。
8.根据权利要求1所述的方法,其特征在于,所述方法还包括,通过以下步骤预先存储待查询的时序数据集:
将待查询的时序数据集的各时序按照所述预定周期划分为多个时序段,并确定各时序段的极值;
根据各时序段的极值,按照预设的第一行键结构确定各时序段对应的行键,其中,所述预设的第一行键结构包含所述时序段的索引、极值和标识,所述时序段的索引和极值构成所述时序段对应的行键前缀部分;
按照各时序段对应的行键将各时序段的时序数据分别存储至分布式服务器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东城市(北京)数字科技有限公司,未经京东城市(北京)数字科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111022473.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种工业泵性能测试系统和方法
- 下一篇:特厚煤层分层开采高效铺网方法





