[发明专利]复杂地理实体快速查询的空间语义模式图构建及搜索方法有效
申请号: | 201611164678.9 | 申请日: | 2016-12-16 |
公开(公告)号: | CN106776502B | 公开(公告)日: | 2017-11-10 |
发明(设计)人: | 刘异;呙维;佘冰;朱欣焰;王绪滢 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F17/22 | 分类号: | G06F17/22;G06F17/30 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙)42222 | 代理人: | 魏波 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 复杂 地理 实体 快速 查询 空间 语义 模式 构建 搜索 方法 | ||
技术领域
本发明属于自然语言位置查询技术领域,特别是涉及一种面向复杂地理实体快速查询的空间语义模式图构建及搜索方法。
背景技术
传统文本相似性方法不能充分利用语义匹配中的结构与词汇类别等语义信息。实际位置描述的省略性、模糊性及为保证召回率所输入的多条匹配结果,易导致组合爆炸问题,造成效率损失。当前空间数据的检索查询分为根据空间范围检索和根据关键词与空间的联合检索。前者包括四叉树、R树等,利于空间数据的快速检索。但其语义过滤较为简单而易为人所忽略。后者常用于结合关键词和空间区域查找最邻近的空间对象,空间检索一般用R索引或格网索引,文本索引一般为倒排形式。但其未利用到由语义匹配产生的位置概念层次语义特征,不适合包含复杂层次结构的位置描述解析。位置概念多字段联合检索依赖于对位置概念建立关系数据表表达,但这种自底往上的查询形式未充分利用位置描述的组合特征对位置概念进行表达和检索,未能融合位置概念的关联特征。
将位置概念描述与实体对应,需将语义搜索结合空间约束进行空间过滤。位置概念具有概念和空间关系的关联性。位置概念的关联关系具有网络性,节点代表位置概念,边表示两者间隶属或等价的关系。表述形式反映概念子部分的组成,展现了位置概念的层次型特征。人类在空间认知中遵循模板匹配的方法,在定位层次型的位置描述中,迭代子元素与记忆中的实体表达比对,找出最可能的结果。人们省略、关联等行为,造成位置描述与位置概念间多对多的关系。这也是歧义的根源之一。从位置描述到位置概念对象需利用位置概念的语义信息,包括组成形式、层次结构及关联关系。从位置描述要能快速得到空间特征。为了建立高效的查询检索,需要一种能快速获取经匹配后的位置描述对应的位置概念对象机制。
发明内容
为了解决上述技术问题,本发明将语义与空间联合索引,提出面向复杂地理实体快速查询的空间语义模式图构建及搜索方法,减少“由底向上”多属性联合查询的排列组合数,避免位置描述中的组合爆炸问题,降低效率损失。
本发明提供的一种复杂地理实体快速查询的空间语义模式图构建方法,包括以下步骤:
步骤1:输入实际位置概念对象;
步骤2:将位置概念对象模式分解入库;
步骤3:逐级构建模式节点,根据模式存储和查询策略利用模式节点的关系压缩模式图;
步骤4:更新模式的空间、统计特征及关联关系;
步骤5:相似性度量并重排序模式节点中的位置概念。
本发明提供的一种复杂地理实体快速查询的空间语义模式图搜索方法,包括以下步骤:
步骤1:输入虚拟位置概念对象lc及参数ls、lr和F;其中ls用于指示lc是否为某个父位置概念对象在模式入库过程中递归的子组成部分,lr代表当ls为真时该子概念对象模式是否需要进行关联搜索,F代表需要进行关联搜索的子概念位置对象;
步骤2:判断lc是否为基础位置概念;
若是,跳过此节点,遍历至下一模式节点,并回转执行步骤2;
若否,继续执行步骤3;
步骤3:初始化返回模式节点PR;
步骤4:遍历lc的子位置概念对象集合;
步骤5:调用要素分解算法获取各子部分的模式编码集合,组成数组PC=(pc1,pc2,…,pcn),pci为第i个子位置概念对象的模式编码集合;
步骤6:得到此位置概念类型对应的模式定义图GP;
步骤7:遍历模式定义节点;
步骤8:判断模式定义节点的要素集合F对应的要素模式编码集合是否为空;
若是,继续执行步骤9;
若不是,则进入下一个模式定义节点,回转执行步骤8;
步骤9:对PC进行模式编码的排列组合,得到模式编码数组C;
步骤10:遍历数组C;
步骤11:查询模式编码是否存在;
若存在,调出之前的模式节点p,将p加入初始化节点关系待更新组P;
若不存在,跳过该模式编码,继续执行步骤11;
步骤12:完成GP遍历,对P向下扩展模式节点,形成新节点关系待更新组P’;
步骤13:对对象lc关联搜索;
步骤14:返回P’对应的模式节点编码集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611164678.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种文本错别字自动更正方法和服务器
- 下一篇:文本语义相似度的确定方法及装置