[发明专利]基于全局区间误差的学习型时空索引方法、装置及介质有效
申请号: | 202111259608.2 | 申请日: | 2021-10-28 |
公开(公告)号: | CN113704565B | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 胡林舒;张丰;陈宁华;覃梦娇;汪愿愿;吴森森;杜震洪;傅晨华 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F16/9537;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 傅朝栋;张法高 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 全局 区间 误差 学习 时空 索引 方法 装置 介质 | ||
1.一种基于全局区间误差的学习型时空索引方法,其特征在于,它的步骤如下:
S1、针对待建立时空索引的时空点数据,分别对经度、纬度和时间三个坐标维度下的坐标值进行重复数据的聚合并按序排列,每一个坐标维度均得到一条坐标值无重复的单调有序序列;
S2、利用分位数转换分别将每一个坐标维度下的单调有序序列映射到均匀分布数据空间,得到每一个坐标维度下的均匀分布序列;
S3、针对每一个坐标维度,分别以该坐标维度下的均匀分布序列全量数据作为训练数据,通过训练全连接神经网络模型得到该坐标维度对应的索引模型,用于根据该坐标维度下的坐标值预测其在该坐标维度下的均匀分布序列中所处的位置;且全连接神经网络模型通过最小化总损失函数进行训练,总损失函数为均方误差损失和全局误差范围损失的加权和,所述全局误差范围损失为训练数据中所有训练样本对应的模型输出误差中最大值和最小值之差;
S4、获取用户输入的经度、纬度和时间三个坐标维度的检索范围,然后将每一个坐标维度的检索范围通过S2中相同的分位数转换映射到均匀分布数据空间得到均匀化检索范围,再通过对应坐标维度的索引模型得到均匀化检索范围内的坐标值在均匀分布序列中的位置分布范围;最终将三个坐标维度的位置分布范围内的重合时空点数据作为用户检索的返回结果。
2.根据权利要求1所述的基于全局区间误差的学习型时空索引方法,其特征在于,所述S1的具体实现步骤包括:
S11、针对所有需要建立时空索引的时空点数据,获取每个时空点的三个维度坐标值以及唯一标志符,其中三个坐标维度分别为经度、纬度和时间;
S12、针对每一个坐标维度
3.根据权利要求2所述的基于全局区间误差的学习型时空索引方法,其特征在于,所述S12中,通过排序和重复点聚合得到坐标值无重复的单调有序序列的方法为:
S121、将所有时空点在目标坐标维度下的坐标值进行分区,坐标值的整数部分相同的划分至同一分区;
S122、针对每一个分区,按照分区内的坐标值小数部分进行排序后,形成有序序列分段;
S123、扫描每一条有序序列分段,将坐标值重复的时空点的唯一标志符拼接为字符串,并聚合关联至对应坐标值下,使每一条有序序列分段中的坐标值均不重复;再将所有有序序列分段按序拼接,形成坐标值无重复的单调有序序列。
4.根据权利要求1所述的基于全局区间误差的学习型时空索引方法,其特征在于,所述S2中,针对每一个坐标维度
S21、按照设定的分位数个数以及单调有序序列的长度,计算每一个分位数在单调有序序列中的位置,从而形成位置序列;
S22、从单调有序序列中提取位置序列中每一个位置对应的坐标值,从而构成分位序列;
S23、根据分位序列,利用一维分段线性插值方法对单调有序序列进行拉伸,从而将其转换为均匀分布数据空间下的均匀分布序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111259608.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可避免弯折的钢丝绳自动加工切丝机
- 下一篇:一种钢丝绳加工清洗一体化设备