[发明专利]基于视觉词袋模型的遥感图像目标识别方法有效
| 申请号: | 201310377651.8 | 申请日: | 2013-08-26 |
| 公开(公告)号: | CN103440508A | 公开(公告)日: | 2013-12-11 |
| 发明(设计)人: | 李士进;仇建斌;张杰;冯钧;万定生;朱跃龙 | 申请(专利权)人: | 河海大学;南京小网科技有限责任公司 |
| 主分类号: | G06K9/66 | 分类号: | G06K9/66 |
| 代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 杨楠 |
| 地址: | 210098 江苏*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于视觉词袋模型的遥感图像目标识别方法,属于图像识别技术领域。本发明针对传统遥感图像目标检测识别算法效果不佳的缺点,将视觉词袋模型引入到高分辨率遥感图像中用于目标的检测识别,同时为了精简视觉单词码本得到精简且最具鉴别力的视觉单词,本发明结合相关性及冗余度分析去除视觉单词码本中不相关、弱相关以及冗余的视觉单词,选出了对目标识别最为重要的视觉单词,减少了后续测试的计算量,提高了效率,为遥感图像目标的检测识别提供了一个新的研究方向。 | ||
| 搜索关键词: | 基于 视觉 模型 遥感 图像 目标 识别 方法 | ||
【主权项】:
1.一种基于视觉词袋模型的遥感图像目标识别方法,其特征在于,首先选取各典型类别目标的遥感图像构建训练集;然后分别提取训练集中各遥感图像以及测试遥感图像的视觉词袋特征;最后利用视觉词袋特征比较测试遥感图像与训练集中各遥感图像之间的相似度,如测试遥感图像与训练集中各遥感图像之间的相似度均小于预设的相似度阈值,则判定测试遥感图像不是待识别目标;如否,则判定测试遥感图像为待识别目标,且其类别为与其相似度最大的训练集遥感图像的目标类别;所述视觉词袋特征按照以下方法提取:步骤1、分别提取训练集中各遥感图像的局部特征,并对所提取出的所有局部特征进行聚类,所得到的每个聚类中心作为一个视觉单词,所有聚类中心构成初始视觉单词码本;步骤2、对初始视觉单词码本进行精简,具体如下:步骤2-1、对视觉单词码本中的每一个视觉单词,分别计算其与目标类别集合之间的类别相关性,并将与目标类别集合之间的类别相关性小于一预设相关性阈值的视觉单词从初始视觉单词码本中剔除,得到去相关后的视觉单词码本;初始视觉单词码本中的第i个视觉单词Fi与目标类别集合C之间的类别相关性
按照下式计算:SU F i , C = 2 [ IG ( C | F i ) H ( F i ) + H ( C ) ] , i = 1,2 , · · · , K ]]> 其中,K为初始视觉单词码本中视觉单词的数目;
是训练集样本类别的熵,Nc是目标类别集合中的目标类别总数,P(C=c)表示训练集样本的类别属于目标类别集合C中的第c类目标类别的概率;
是视觉单词Fi在所有目标类别样本分布上的熵,P(fc=Fi)表示类别属于目标类别集合C中的第c类目标类别的训练集样本的局部特征中包含视觉单词Fi的概率;IG(C|Fi)是视觉单词Fi对目标类别分类的信息增益,其计算公式如下:IG(C|Fi)=H(C)-H(C|Fi)其中H ( C | F i ) = - Σ c = 1 N c P ( f c = F i ) Σ c ′ = 1 N c P ( C = c ′ | f c = F i ) log 2 P ( C = c ′ | f c = F i ) ]]> 给定视觉单词Fi时类别的条件信息熵,P(C=c'|fc=Fi)表示训练集样本的局部特征中包含视觉单词Fi时目标类别集合C中的第c'类目标类别的条件概率;步骤2-2、初始化集合变量Wlist、Wlist'为空;将去相关后的视觉单词码本中的所有视觉单词加入到集合Wlist'中,并按
值对Wlist'中的所有视觉单词进行降序排列;步骤2-3、对Wlist'中每一当前排序第一的视觉单词Fj,计算该视觉单词与Wlist'中其他任一视觉单词Fi,i≠j之间的对称不确定性
若
则将Fi从Wlist'中去除;当Fj与Wlist'中所有其他视觉单词都计算一轮后,将Fj加入到集合Wlist中,同时在Wlist'中删除Fj;视觉单词Fj和Fi之间的对称不确定性
按照下式计算:SU F i , F j = 2 [ IG ( F j | F i ) H ( F i ) + H ( F j ) ] ]]> 其中,H ( F i ) = - Σ c = 1 N c P ( f c = F i ) log 2 P ( f c = F i ) , ]]>H ( F j ) = - Σ c = 1 N c P ( f c = F j ) log 2 P ( f c = F j ) ]]> 分别为视觉单词Fi、Fj在所有目标类别样本分布上的熵,P(fc=Fi)、P(fc=Fj)分别表示类别属于目标类别集合C中的第c类目标类别的训练集样本的局部特征中包含视觉单词Fi、Fj的概率;IG(Fj|Fi)是视觉单词Fi对视觉单词Fj的信息增益,其计算公式如下:IG(Fj|Fi)=H(Fj)-H(Fj|Fi)其中,H ( F j | F i ) = - Σ c = 1 N c P ( f c = F i ) Σ c ′ = 1 N c P ( f c ′ = F j | f c = F i ) log 2 P ( f c ′ = F j | f c = F i ) ]]> 表示给定视觉单词Fi时视觉单词Fj的条件信息熵,P(fc′=Fj|fc=Fi)表示类别属于目标类别集合C中的第c类目标类别的训练集样本的局部特征中包含视觉单词Fi时类别属于目标类别集合C中的第c'类目标类别的包含视觉单词Fj的条件概率;步骤2-4、重复步骤2-3的操作,直到集合Wlist'为空;此时集合Wlist即为精简后的视觉单词码本;步骤3、对所要提取特征的一幅遥感图像,将其每个局部特征分配给精简后的视觉单词码本中与其欧式距离最近的视觉单词,然后统计该遥感图像所有局部特征隶属于精简后的视觉单词码本中所有视觉单词的分布直方图,该分布直方图即为该遥感图像的视觉词袋特征。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学;南京小网科技有限责任公司,未经河海大学;南京小网科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310377651.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种包装体热封口系统
- 下一篇:食堂自动叠盘机





