[发明专利]一种基于倒排文本的带关系属性的空间查询优化方法在审

专利信息
申请号: 201910575917.7 申请日: 2019-06-28
公开(公告)号: CN111475599A 公开(公告)日: 2020-07-31
发明(设计)人: 刘亮;王海峰;王益挺;万杰 申请(专利权)人: 国网江苏省电力有限公司;国家电网有限公司;南京航空航天大学;南瑞集团有限公司
主分类号: G06F16/31 分类号: G06F16/31;G06F16/387;G06F16/33;G06F16/29;G06F16/22;G06F16/2453
代理公司: 南京业腾知识产权代理事务所(特殊普通合伙) 32321 代理人: 缪友益
地址: 210008 江*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 文本 关系 属性 空间 查询 优化 方法
【权利要求书】:

1.一种基于倒排文本的带关系属性的空间查询优化方法,其特征在于,包括如下步骤:

(1)采用倒排文件的方式,构建带关系属性的空间索引;

空间索引包含空间对象o={g,p}的地理位置信息o.g和关系属性信息o.p,其中,地理位置信息o.g=(lon,lat),lon和lat分别表示坐标经纬度,将每个对象的真实经纬度都转换成包含地理位置信息的结构体索引Geopoint,并存储在倒排文件中;关系属性信息o.p={p',s}包括数值点属性o.p.p'={〖p'〗_1,〖p'〗_2,…,〖p'〗_n}和数值段属性o.p.s={s_1,s_2,…,s_m},数值点属性和数值段属性存储在倒排文件中;

(2)接收来自用户的范围查询请求,将查询语句拆分为空间位置信息查询和关系属性查询两个部分,拆分完的两个子查询语句再转换成Query格式语句用AND连接通过构建的空间索引进行查询。

2.根据权利要求1所述的基于倒排文本的带关系属性的空间查询优化方法,其特征在于,构建带关系属性的空间索引的具体步骤为:

a)数据预处理:通过数据预处理模块处理从原数据集提取结构化的对象数据,建立结构化对象数据库ObjectBase;

b)构建索引:采用Lucene的倒排索引方式完成索引步骤,将包含行键信息和列信息的ObjectBase封装在一个文档内,然后IndexWriter为文档创建倒排索引,建立索引数据库IndexBase。

3.根据权利要求2所述的基于倒排文本的带关系属性的空间查询优化方法,其特征在于,结构化对象数据库ObjectBase的建立由MapReduce作业通过ObjectInputFormat和ExtractMap实现。

4.根据权利要求2所述的基于倒排文本的带关系属性的空间查询优化方法,其特征在于,索引数据库IndexBase的建立由MapReduce作业完成,该作业的输入是一堆键值对,每个Key都由ObjectBase中一个记录的行键组成,每个Value就是对应记录的列族值,HBase库的IdentityTableMap类可以将HBase表的记录转换为这种类型的密钥对。

5.根据权利要求1所述的基于倒排文本的带关系属性的空间查询优化方法,其特征在于,步骤(2)中空间位置信息查询分成对纬度和经度的范围查询,将空间划分范围坐标lowlon,highlon,lowlat,highlat转换为纬度和经度上的范围条件lowlon≤Q.R.lon≤highlon)∧(lowlat≤Q.R.lat≤highlat;用户查询语句中的geopoint=lowlon,highlon,lowlat,highlat通过预处理程序转化为[(lowlon,lowlat),(highlon,highlat)]代表范围的两个坐标,再将这两个坐标转成两个包含不等式的范围查询语句Query:(Q.R.lon≥lowlon AND Q.R.lon≤highlon)和Query:(Q.R.lat≥lowlat ANDQ.R.lat≤highlat),然后通过AND将两个范围查询语句连接,得到最终的查询语句Query:(Q.R.lon≥lowlon AND Q.R.lon≤highlon AND Q.R.lat≥lowlat AND Q.R.lat≤highlat)。

6.根据权利要求5所述的基于倒排文本的带关系属性的空间查询优化方法,其特征在于,步骤(2)中关系属性查询attributes=Q.δ_1ω_1,Q.δ_1ω_1',…,Q.δ_n=ω_n通过文本切分器切分成n个算式;

针对数值段查询,生成以AND连接的关键字域查询语句Query:(Q.δ1ω1 AND Q.δ1ω1′),针对数值点查询,生成相应关键字域查询语句Query:(Q.δn=ωn),最后将各查询语句以AND连接,得到Query:(Q.δ1ω1 AND Q.δ1ω1′)AND…AND Q.δn=ωn),通过倒排文件进行查询。

7.根据权利要求1所述的基于倒排文本的带关系属性的空间查询优化方法,其特征在于,步骤(1)中关系属性信息数值点属性将字段名与数值点用下划线连接,以f_1_〖p'〗_1,f_2_〖p'〗_2,…,〖f_n_p'〗_n的形式存储在倒排文件中;将s_1,s_2,…,s_m转成离散点属性,即将区间[s_(i min),s_(i max)]转化为一系列点与字段名以下划线连接,以〖f_i_s〗_(i min),f_i_s_(i2),〖f_i_s〗_(i3),…,〖f_i_s〗_(i max)的形式存储在倒排文件中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江苏省电力有限公司;国家电网有限公司;南京航空航天大学;南瑞集团有限公司,未经国网江苏省电力有限公司;国家电网有限公司;南京航空航天大学;南瑞集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910575917.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top