[发明专利]一种基于对象语义树模型的遥感人造地物目标识别方法有效
申请号: | 201010207538.1 | 申请日: | 2010-06-13 |
公开(公告)号: | CN102279929A | 公开(公告)日: | 2011-12-14 |
发明(设计)人: | 孙显;付琨;王宏琦 | 申请(专利权)人: | 中国科学院电子学研究所 |
主分类号: | G06K9/66 | 分类号: | G06K9/66;G06T7/00 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 周长兴 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 对象 语义 模型 遥感 人造 地物 目标 识别 方法 | ||
1.一种基于对象语义树模型的遥感图像人造地物目标识别方法,包括以下主要步骤:
第一步,建立遥感地物目标代表图像集;
第二步,对遥感地物目标代表图像集中的图像采用多尺度方法进行分割,得到每幅图像的对象树;
第三步,采用LDA方法对对象树中每一个结点建模,计算树结点对象内包含的隐含类别语义特征;
第四步,获取代表集中所有图像的对象树集合对每一对对象树进行匹配学习,从中提取出共有最大子树;
第五步,采用逐步添加法将所有最大共有子树组合在一起,形成描述目标类别的对象语义树;
第六步,根据对象语义树对人造地物目标进行识别,得到目标的所在区域。
2.如权利要求1所述的方法,其中,
第一步包括:
1.1)根据需要定义J个遥感地物目标类别,类别编号为1~J,J为自然数;
1.2)对每个遥感地物目标类别,选取多幅图像作为该类目标的代表图像;
1.3)对每幅遥感地物目标代表图像进行标绘,标记出目标所在的区域范围;
1.4)将所有J类目标的代表图像合并为遥感地物目标代表图像集;
第二步包括:
2.1)利用指数函数定义线性尺度空间,在尺度Sl和层次l间构建关系,并计算图像各个层次的分割对象块数Kl;
2.2)将给定的第l层图像视为四向连接图,把Normalized-cut分割算法与每层分割对象块数Kl相关联,获取图像分割结果,从l-1层开始,依据上一层分割结果,生成新的连接图继续粗化分割,由上到下递归处理构建对象分割树;
第三步包括:
3.1)对于分割树中的每一个结点对象,在对象所在区域中计算局部梯度方向直方图得到SIFT特征,该SIFT特征为一个128维的特征向量;
3.2)使用K-Means聚类方法对代表集中所有图像各个层次上的SIFT特征进行量化,每个聚类中心的取值对应一个视觉单词,构成通用视觉词汇表,可通过改变聚类中心个数调整单词个数N,N取值范围为500至3000之间;
3.3)对分割树中的每一个结点对象进行视觉单词映射描述,应用LDA分析方法对每一个结点对象构建模型,求解模型参数后计算得到每一个结点对象内包含的隐含主题类别概率分布,步骤如下:
3.3.1)约定映射关系,令特征描述子对应视觉单词w,为N个单词集合中的一项,结点对象对应文档D,由M个单词序列D={w1,w2,...,wM}组成;
3.3.2)随机生成一个1×k的向量θ,该向量服从Dirichlet分布,k为主题个数,选择主题zn服从多项式分布,选择单词wn的分布p(wn|zn,β)为主题zn的多项式条件分布,单词的概率参数β为k×N矩阵,其中βij=p(wj=1|zi=1);
3.3.3)获取结点对象中主题Z、N个单词w及混合参数θ的联合分布,通过变分EM的方法求解LDA模型中控制参数(α,β)的解,其中α反映了图像集合中隐含主题间的相对强弱,β刻画所有隐含主题自身的概率分布;
3.3.4)解得模型参数后,得到每一个对象包含各个类别主题的概率分布,以类别直方图的形式表示;
第四步包括:
4.1)优化分割对象树,考察每个树中的每一对相邻结点,当其满足合并条件时,将两个结点合并为一个结点,以父对象结点的形式插入到待合并区域的上一级,将树结构转换为有向无环图的形式;
4.2)在每个有向无环图的上下级结点中添加新边,构建传递闭包,实现结点间和子结点间的匹配;
4.3)将所有分割树转换而成的有向无环图逐个配对,使用编辑距离操作计算相似匹配度,所有编辑操作的代价总和相加,得到两个有向无环图的最终相似度量;对于J幅遥感地物目标代表图像,共计获得J(J-1)个树对用于计算子树的相似度,当相似度大于相似阈值thsimi时,认为该子树是体现目标共有子目标或部件的区域,相似阈值取值为0.5;
第五步包括:
5.1)给定子树t和t′,组合树为其中ε1=ε(τ,t),ε2=ε(τ,t′),依次从中选取一个新的子树t,与已有的组合树相匹配,形成新的组合树
5.2)对于树结点的区域属性ψv,记录之前各轮迭代中结点的区域属性值的集合{ψv′},然后取ψv为集合中所有属性的均值;
5.3)由于取出子树顺序的不同会影响组合结果的不同,随机选定三种组合顺序,计算组合树的匹配熵,选取匹配熵最小值所对应的结果为目标类别最终的对象语义树;
第六步包括,按照本发明第二、三步所述获得待识别图像的对象树结构,从该对象树中自上而下选取子树t1,t2,...tL,提交给对象语义树模型,获得各个子树的匹配相似度s1,s2,...sL,选取最优相似sbest=arg maxssl对应的子树即为目标所在的结构,还原对应的对象结点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院电子学研究所,未经中国科学院电子学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010207538.1/1.html,转载请声明来源钻瓜专利网。