[发明专利]一种基于空间关系的潜在狄利克雷模型自然场景图像分类方法在审

专利信息
申请号: 201410055126.9 申请日: 2014-02-18
公开(公告)号: CN103942573A 公开(公告)日: 2014-07-23
发明(设计)人: 王爽;焦李成;张雪;陈阳平;马晶晶;马文萍;侯彪 申请(专利权)人: 西安电子科技大学
主分类号: G06K9/66 分类号: G06K9/66
代理公司: 西安智萃知识产权代理有限公司 61221 代理人: 李东京
地址: 710071 陕西省*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 空间 关系 潜在 狄利克雷 模型 自然 场景 图像 分类 方法
【权利要求书】:

1.一种基于空间关系的潜在狄利克雷模型自然场景图像分类方法,其特征是:包括如下步骤:

(1)分别建立自然场景图像分类训练集和图像分类测试集;

(2)用空间金字塔分块方法分别对自然场景图像分类训练集和图像分类测试集中的图像进行图像分块,得到图像块集合P={P1,P2,…,Pi,…,Pn},其中Pi为图像的第i个图像块,n为图像的分块总数;

(3)提取训练集中图像的图像块集合P的采样点尺度不变特征集合F,生成字典D:

(3a)用网格采样方法对训练集中图像的图像块集合P进行网格采样,得到图像的图像块网格采样点集SP={SP1,SP2,…,SPi,…,SPn},其中SPi为图像第i个图像块的网格采样点;

(3b)用尺度不变特征提取方法对训练集中图像的图像块网格采样点SP提取尺度不变特征,得到训练集中图像的图像块尺度不变特征集合F={F1,F2,…,Fi,…,Fn},其中Fi为图像第i个图像块的尺度不变特征;

(3c)用K均值聚类算法分别对训练集上图像的图像块尺度不变特征集合F进行聚类,生成字典D={D1,D2,…,Di,…,Dn},其中Di为图像第i个图像块生成的字典;

(4)用字典D对训练集中图像的图像块尺度不变特征集合F进行词袋模型描述,得到图像的图像块对应的词汇频次W={W1,W2,…,Wi,…,Wn},其中Wi为图像第i个图像块对应的词汇频次向量;

(5)用Gibbs采样方法估计潜在狄利克雷模型中的隐参数,得到训练集中图像的潜在语义主题模型Z和潜在语义主题分布θ;

(6)用图像潜在语义主题模型Z生成测试集中图像潜在语义主题分布θ1

(7)将训练集中图像的潜在语义主题分布θ和其对应的类别l作为训练数据,用支撑向量机SVM算法获得自然场景分类模型E;

(8)根据自然场景分类模型E对测试图像进行分类。

2.根据权利要求1所述的一种基于空间关系的潜在狄利克雷模型自然场景图像分类方法,其特征是:其中步骤(1)所述的分别建立自然场景图像分类训练集和图像分类测试集,是先根据使用需要定义N个自然场景图像类别,类别编号为1~N;再在每个自然场景图像类别中随机选取50~100幅图像组成自然场景图像分类训练集,其余图像组成自然场景图像分类测试集。

3.根据权利要求1所述的一种基于空间关系的潜在狄利克雷模型自然场景图像分类方法,其特征是:其中步骤(5)用Gibbs采样方法估计潜在狄利克雷模型中的隐参数,得到训练集中图像的潜在语义主题模型Z和潜在语义主题分布θ,按如下步骤进行:

(5a)将wi对应词汇被分配的潜在语义主题zi赋值为1~T任意值,作为马尔可夫链的初始状态,其中T为正整数;

(5b)利用迭代公式1),分别计算图像中第i个词汇wi被分配给主题1~T的概率P(zi=j|z-i,w):

P(zi=j|z-i,w)=n-i,j(wi)+βn-i,j(·)+·n-i,j(di)+αn-i,·(di)+Σj=1Tn-i,j(wi)+βn-i,j(·)+·n-i,j(di)+αn-i,·(di)+---1)]]>

其中,j表示潜在语义主题,取值范围为1~T,z-i表示除wi对应词汇以外的词汇被分配的潜在语义主题情况;表示wi对应词汇被分配给潜在语义主题j的个数,表示被分配给潜在语义主题j的词汇总数,表示训练集中第i幅图像di中分配给潜在语义主题j的词汇总数,表示训练集中第i幅图像di中的词汇总数,T为潜在语义主题总数,W表示图像对应的多尺度稀疏表示向量,α为超参数,β为超参数;

(5c)取分配概率最大的主题更新该wi的主题分配状态,得到马尔可夫链的下一个状态,当迭代次数C=100时,迭代结束;

(5d)迭代结束后,得到需要求解的图像潜在语义主题模型Z和潜在语义主题分布θ:

Z=nj(w)+βnj(·)+---2)]]>

θ=nj(d)+αn·(d)+]]>

其中,表示图像d中词汇w被分配给潜在语义主题模型j的个数,表示图像d中被分配给潜在语义主题模型j的词汇总数,表示图像d被分配的潜在语义主题j的总数,表示图像d被分配的所有潜在语义主题总数,T为潜在语义主题总数,W表示图像对应的多尺度稀疏表示向量,α为超参数,β为超参数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201410055126.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top