[发明专利]一种基于机器学习的空间数据匹配方法有效
| 申请号: | 201310726445.3 | 申请日: | 2013-12-25 | 
| 公开(公告)号: | CN103646109B | 公开(公告)日: | 2017-01-25 | 
| 发明(设计)人: | 张翔;艾廷华;赵羲;杨敏 | 申请(专利权)人: | 武汉大学 | 
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 | 
| 代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙)42222 | 代理人: | 鲁力 | 
| 地址: | 430072 湖*** | 国省代码: | 湖北;42 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 机器 学习 空间 数据 匹配 方法 | ||
1.一种基于机器学习的空间数据匹配方法,其特征在于,定义两个待匹配的两个空间数据集,分别记作:目标集合D={di},0≤i≤n,和集合G={gj},0≤j≤m;这两个集合中形成的所有关系属于这两个集合的笛卡尔乘积:
rij=<di,gj>∈D×G,
具体包括以下步骤:
步骤1,根据输入数据生成训练样本数据:即从两个待匹配的两个空间数据集分别进行随机采样数据,构成两个随机采样子数据集;根据两个两个随机采样子数据集建立正确匹配目标对数据库和错误匹配目标对数据库:并根据建立的正确匹配目标对数据库和错误匹配目标对数据库建立训练样本模式TP={(f1,c1),...,(fn,cn)},其中fi(1≤i≤n)为样本集合中第i个样本的特征向量,ci为该样本的分类类别,取值为匹配或不匹配;ci取值为匹配的类别定义为正样本TP+;ci取值为不匹配的类别定义为负样本TP-;
步骤2,基于机器学习建立匹配模型:即针对步骤1中简历的训练样本模式TP进行机器学习,来建立一个分类器函数g:D×G→C;其中,C={匹配,不匹配},亦即样本目标对的分类类别集合;所述分类器函数g的匹配结果为两种,即匹配和不匹配;
步骤3,将两个待匹配的两个空间数据集中的目标两两进行任意组合,形成目标对<di,gj>的集合,然后计算每对目标的特征向量,并输入已建立的分类器模型,通过分类器算法计算得到初步匹配结果;
步骤4,根据逻辑约束条件,对步骤3中的初步匹配结果进行过滤与改善后结束;
所述逻辑约束条件指匹配结果中出现明显不合逻辑的多对多匹配结果,其规则为:合理的多对多匹配形式为m:n,其中m为多对多匹配中包含的di的数目,n为gj的数目,条件m≠n必须满足;若出现了多对多的匹配关系,而m和n是相等的,即判定为违反了逻辑约束条件,应把该类多对多关系分解为多个一对一匹配关系。
2.根据权利要求1所述的一种基于机器学习的空间数据匹配方法,其特征在于,所述步骤1中,针对待匹配的两个空间数据集中,考虑所有潜在匹配关系集合,应属于D×G的子集,故任意目标对rij被归结为C={匹配,不匹配}两种类别;同时,对rij可提取其n维特征向量,记作模式(rij;fk|fk1,...,fkn);根据模式在n维特征空间中的分布,可将rij标记为一个特定类别ck∈C,此为目标匹配问题的模式分类定义,该定义下目标匹配的关键在于找到合适的映射函数g:D×G→C,以实现从输入模式(rij;fk)到类别ck的映射,从而获得匹配结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310726445.3/1.html,转载请声明来源钻瓜专利网。





