[发明专利]一种基于倒排文本的带关系属性的空间查询优化方法在审
| 申请号: | 201910575917.7 | 申请日: | 2019-06-28 |
| 公开(公告)号: | CN111475599A | 公开(公告)日: | 2020-07-31 |
| 发明(设计)人: | 刘亮;王海峰;王益挺;万杰 | 申请(专利权)人: | 国网江苏省电力有限公司;国家电网有限公司;南京航空航天大学;南瑞集团有限公司 |
| 主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/387;G06F16/33;G06F16/29;G06F16/22;G06F16/2453 |
| 代理公司: | 南京业腾知识产权代理事务所(特殊普通合伙) 32321 | 代理人: | 缪友益 |
| 地址: | 210008 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 文本 关系 属性 空间 查询 优化 方法 | ||
1.一种基于倒排文本的带关系属性的空间查询优化方法,其特征在于,包括如下步骤:
(1)采用倒排文件的方式,构建带关系属性的空间索引;
空间索引包含空间对象o={g,p}的地理位置信息o.g和关系属性信息o.p,其中,地理位置信息o.g=(lon,lat),lon和lat分别表示坐标经纬度,将每个对象的真实经纬度都转换成包含地理位置信息的结构体索引Geopoint,并存储在倒排文件中;关系属性信息o.p={p',s}包括数值点属性o.p.p'={〖p'〗_1,〖p'〗_2,…,〖p'〗_n}和数值段属性o.p.s={s_1,s_2,…,s_m},数值点属性和数值段属性存储在倒排文件中;
(2)接收来自用户的范围查询请求,将查询语句拆分为空间位置信息查询和关系属性查询两个部分,拆分完的两个子查询语句再转换成Query格式语句用AND连接通过构建的空间索引进行查询。
2.根据权利要求1所述的基于倒排文本的带关系属性的空间查询优化方法,其特征在于,构建带关系属性的空间索引的具体步骤为:
a)数据预处理:通过数据预处理模块处理从原数据集提取结构化的对象数据,建立结构化对象数据库ObjectBase;
b)构建索引:采用Lucene的倒排索引方式完成索引步骤,将包含行键信息和列信息的ObjectBase封装在一个文档内,然后IndexWriter为文档创建倒排索引,建立索引数据库IndexBase。
3.根据权利要求2所述的基于倒排文本的带关系属性的空间查询优化方法,其特征在于,结构化对象数据库ObjectBase的建立由MapReduce作业通过ObjectInputFormat和ExtractMap实现。
4.根据权利要求2所述的基于倒排文本的带关系属性的空间查询优化方法,其特征在于,索引数据库IndexBase的建立由MapReduce作业完成,该作业的输入是一堆键值对,每个Key都由ObjectBase中一个记录的行键组成,每个Value就是对应记录的列族值,HBase库的IdentityTableMap类可以将HBase表的记录转换为这种类型的密钥对。
5.根据权利要求1所述的基于倒排文本的带关系属性的空间查询优化方法,其特征在于,步骤(2)中空间位置信息查询分成对纬度和经度的范围查询,将空间划分范围坐标lowlon,highlon,lowlat,highlat转换为纬度和经度上的范围条件lowlon≤Q.R.lon≤highlon)∧(lowlat≤Q.R.lat≤highlat;用户查询语句中的geopoint=lowlon,highlon,lowlat,highlat通过预处理程序转化为[(lowlon,lowlat),(highlon,highlat)]代表范围的两个坐标,再将这两个坐标转成两个包含不等式的范围查询语句Query:(Q.R.lon≥lowlon AND Q.R.lon≤highlon)和Query:(Q.R.lat≥lowlat ANDQ.R.lat≤highlat),然后通过AND将两个范围查询语句连接,得到最终的查询语句Query:(Q.R.lon≥lowlon AND Q.R.lon≤highlon AND Q.R.lat≥lowlat AND Q.R.lat≤highlat)。
6.根据权利要求5所述的基于倒排文本的带关系属性的空间查询优化方法,其特征在于,步骤(2)中关系属性查询attributes=Q.δ_1ω_1,Q.δ_1ω_1',…,Q.δ_n=ω_n通过文本切分器切分成n个算式;
针对数值段查询,生成以AND连接的关键字域查询语句Query:(Q.δ1ω1 AND Q.δ1ω1′),针对数值点查询,生成相应关键字域查询语句Query:(Q.δn=ωn),最后将各查询语句以AND连接,得到Query:(Q.δ1ω1 AND Q.δ1ω1′)AND…AND Q.δn=ωn),通过倒排文件进行查询。
7.根据权利要求1所述的基于倒排文本的带关系属性的空间查询优化方法,其特征在于,步骤(1)中关系属性信息数值点属性将字段名与数值点用下划线连接,以f_1_〖p'〗_1,f_2_〖p'〗_2,…,〖f_n_p'〗_n的形式存储在倒排文件中;将s_1,s_2,…,s_m转成离散点属性,即将区间[s_(i min),s_(i max)]转化为一系列点与字段名以下划线连接,以〖f_i_s〗_(i min),f_i_s_(i2),〖f_i_s〗_(i3),…,〖f_i_s〗_(i max)的形式存储在倒排文件中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网江苏省电力有限公司;国家电网有限公司;南京航空航天大学;南瑞集团有限公司,未经国网江苏省电力有限公司;国家电网有限公司;南京航空航天大学;南瑞集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910575917.7/1.html,转载请声明来源钻瓜专利网。





