[发明专利]一种基于机器学习的空间数据匹配方法有效
申请号: | 201310726445.3 | 申请日: | 2013-12-25 |
公开(公告)号: | CN103646109B | 公开(公告)日: | 2017-01-25 |
发明(设计)人: | 张翔;艾廷华;赵羲;杨敏 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙)42222 | 代理人: | 鲁力 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 空间 数据 匹配 方法 | ||
技术领域
本发明属于地理信息处理技术领域,特别是涉及一种基于机器学习的空间数据匹配方法。
背景技术
空间数据集成融合是目前地理信息应用的一项触发技术,在整个地理信息处理、加工、分析、挖掘中处于核心地位,其中的关键技术问题在于多源空间数据的目标匹配。目标匹配的常见应用包括:空间数据增量式更新、多重表达数据库、多尺度空间分析、跨数据库一致性维护、VGI数据质量评价、跨数据库属性传输与数据增强等。然而,由于空间数据采集的数学基础、精度、建库目的以及对数据细节的概括化简程度等不同,多源空间数据在目标级别上进行匹配十分困难,具有较大不确定性。
现有的数据匹配方法有两个层次,第一个层次是从空间参考系上对空间数据进行统一,比如通过重新投影或者进行基准面的转换,如使用Helmert七参数,或Molodensky-Badekas十参数变换等,来对空间数据的数学基础进行统一,可认为是对空间数据的整体配准、定位。然而,该层次的配准较为粗糙,并不能完全解决上述目标级别的匹配问题:在空间数据的数学基础统一后仍然存在大量目标级别的空间位移,不能简单通过位置关系进行匹配,对空间数据的集成融合带来极大困难。
第二个层次的匹配是直接操作空间目标,通过除位置信息外的其他信息对不同数据源的目标间的相似性进行评估,从而得到目标匹配结果。这类目标匹配方法所使用的相似性指标主要分为空间几何(包括位置、角度、形状、拓扑等)、语义和上下文关系指标。
基于语义的匹配方法依赖空间数据库的属性信息,而当前大多数测绘数据,无论是官方、商业或众包地理数据(如OpenStreetMap等),其属性信息采集或内容不完善,或分布不均一,或质量参差不齐,这使得语义匹配方法在实际应用中有较大局限性。
上述方法中在涉及多个相似性指标时必须在系统的某个时刻将多指标进行融合,并最终决定在何种指标相似性主导下得到匹配结论。然而,上述方法在多目标决策中一般采用加权平均,专家定权这种较为传统的手段进行处理,使得多指标决策问题往往没有得到较好解决。问题的核心在于,不同指标的量纲标准化(normalization)以及权重确定存在极大的主观任意性,导致匹配结果并非最优。此外,基于单一相似性指标的方法不能解决复杂情况下的目标匹配问题。因此,有必要研发更加合理的方法来解决匹配中的多指标决策问题。
发明内容
本发明主要针对上述不足之处,提供一种基于机器学习的空间数据匹配方法,在多源空间数据目标匹配中克服单一指标匹配精度低,多指标决策中的量纲标准化和权重确定中的主观任意性问题。
本发明通过以下技术方案达到上述目标:
一种基于机器学习的空间数据匹配方法,其特征在于,定义两个待匹配的两个空间数据集,分别记作:目标集合D={di},0≤i≤n,和集合G={gj},0≤j≤m;这两个集合中形成的所有关系属于这两个集合的笛卡尔乘积:
rij=<di,gj>∈D×G,
具体包括以下步骤:
步骤1,根据输入数据生成训练样本数据:即从两个待匹配的两个空间数据集分别进行随机采样数据,构成两个随机采样子数据集;根据两个两个随机采样子数据集建立正确匹配目标对数据库和错误匹配目标对数据库:并根据建立的正确匹配目标对数据库和错误匹配目标对数据库建立训练样本模式TP={(f1,c1),...,(fn,cn)},其中fi(1≤i≤n)为样本集合中第i个样本的特征向量,ci为该样本的分类类别,取值为匹配或不匹配;ci取值为匹配的类别定义为正样本TP+;ci取值为不匹配的类别定义为负样本TP-;
步骤2,基于机器学习建立匹配模型:即针对步骤1中简历的训练样本模式TP进行机器学习,来建立一个分类器函数g:D×G→C;其中,C={匹配,不匹配},亦即样本目标对的分类类别集合;所述分类器函数g的匹配结果为两种,即匹配和不匹配;
步骤3,将两个待匹配的两个空间数据集中的目标两两进行任意组合,形成目标对<di,gj>的集合,然后计算每对目标的特征向量,并输入已建立的分类器模型,通过分类器算法计算得到初步匹配结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310726445.3/2.html,转载请声明来源钻瓜专利网。