[发明专利]基于码书块稀疏的非负稀疏编码的图像特征提取方法有效
申请号: | 201510567121.9 | 申请日: | 2015-09-08 |
公开(公告)号: | CN105224944B | 公开(公告)日: | 2018-10-30 |
发明(设计)人: | 王进军;石伟伟;龚怡宏;张世周 | 申请(专利权)人: | 西安交通大学 |
主分类号: | G06K9/46 | 分类号: | G06K9/46 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 闵岳峰 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 码书块 稀疏 编码 图像 特征 提取 方法 | ||
本发明基于码书块稀疏的非负稀疏编码的图像特征提取方法,包括步骤:1)对待处理的图像数据集中所有图像分别稠密地提取块级特征;2)随机地选取若干块级特征;3)建立基于码书块稀疏的非负稀疏编码模型;4)用随机选取的块级特征来求解出该图像数据集块级特征的码书;5)固定码书,对所有的块级特征进行基于码书块稀疏的非负稀疏编码;6)对图像数据集每张图像的编码进行空间金字塔最大池化方法整合;7)按照基于码书块稀疏的非负稀疏编码模型的目标函数,求出该图像数据集空间金字塔最大池化后的初级特征向量的码书,对空间金字塔最大池化后的初级特征向量再进行一次基于码书块稀疏的非负稀疏编码,得到每张图像最终的特征向量。
技术领域:
本发明涉及计算机视觉图像处理技术领域,具体涉及一种基于码书块稀疏的非负稀疏编码的图像特征提取方法。
背景技术:
稀疏编码已广泛应用于计算机视觉的各个领域(例如,图像分类、图像去噪等等),传统的稀疏编码方法仅仅要求编码是稀疏的(所谓稀疏是指编码中的零元素较多),而对码书的结构没有做任何要求,最近的一些实验结果表明:使用一个精心设计的码书往往能取得更好的编码结果;非负的编码在应用中往往有更好的稳定性。同时,一些研究结果表明,图像是由一些局部的小像素块拼接组成,使用一定数目学习出来的小的局部像素块,可以组合出来所有的自然图像,现有的稀疏编码方法并没有体现出这种局部性。传统的用稀疏编码提取图像特征的方法仅仅对块级特征做一次编码,这样的得到的图像特征在应用中不具有较强的判别性。
发明内容:
本发明的目的在于针对现有技术的不足,提供了一种基于码书块稀疏的非负稀疏编码的图像特征提取方法。
为达到上述目的,本发明采用如下技术方案:
基于码书块稀疏的非负稀疏编码的图像特征提取方法,包括以下步骤:
1)对待处理的图像数据集中所有图像分别稠密地提取块级特征;
2)对待处理的图像数据集中所有图像提取完块级特征后,随机地选取10万至50万的块级特征用于求该待处理的图像数据集块级特征的码书;
3)建立基于码书块稀疏的非负稀疏编码模型;
4)根据步骤2)和步骤3),用随机选取的块级特征来求解出该图像数据集块级特征的码书;
5)该图像数据集块级特征的码书求解出来后,固定码书,对所有的块级特征进行基于码书块稀疏的非负稀疏编码;
6)对图像数据集每张图像的编码进行空间金字塔最大池化方法整合,得到每张图像的初级特征向量;
7)按照基于码书块稀疏的非负稀疏编码模型的目标函数,求出该图像数据集空间金字塔最大池化后的初级特征向量的码书,对空间金字塔最大池化后的初级特征向量再进行一次基于码书块稀疏的非负稀疏编码,得到每张图像最终的特征向量,用于计算机视觉任务。
本发明进一步的改进在于,步骤1)中,对待处理的图像数据集中所有图像按照16至32的像素块以及6至10的滑动步长,稠密地提取每个图像的块级特征。
本发明进一步的改进在于,步骤3)中,块级特征编码是非负的,码书的每一列是分块稀疏的。
本发明进一步的改进在于,步骤3)中,设码书为D=[d1,d2,…,dk],D∈Rp×k的每一列表示一个基向量,块级特征向量xj在基矩阵下相应的稀疏编码为cj,j=1,2,…,n,n为随机选取的块级特征的数目,X=[x1,x2,…,xn]为随机选取的块级特征形成的矩阵,编码矩阵C=[c1,c2,…,cn],基于码书块稀疏的非负稀疏编码模型的目标函数如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510567121.9/2.html,转载请声明来源钻瓜专利网。