[发明专利]一种基于词袋模型的图像描述方法及系统有效

申请号：	201410491596.X	申请日：	2014-09-23
公开（公告）号：	CN104299010B	公开（公告）日：	2017-11-10
发明（设计）人：	李岩山;谢维信;黄庆华;李晓棠;高志坚	申请（专利权）人：	深圳大学
主分类号：	G06K9/66	分类号：	G06K9/66
代理公司：	深圳市恒申知识产权事务所(普通合伙)44312	代理人：	陈健
地址：	518060 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于模型图像描述方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于图像处理领域，尤其涉及一种基于词袋模型的图像描述方法及系统。

背景技术

在图像处理领域，图像描述作为图像标注、检索、分类等的关键技术，已吸引了越来越多研究者的关注。随着多媒体、互联网技术及可移动设备的发展，需要处理识别的图像数量呈爆炸式增长，从而对图像处理能力提出了更高要求。基于词袋模型的图像描述方法作为图像描述的有效方法，通过对图像的底层特征进行编码形成直方图矢量以对图像进行描述，具有处理效率高、分析准确度高的特点，特别适用于对大规模图像信息的处理。

现有技术提供的基于词袋模型的图像描述方法主要包括以下步骤：首先，从训练图像中提取特征点，对特征点进行聚类，获得码书；之后，从待描述图像中提取特征点，利用码书将特征点映射为视觉单词；之后，统计每一视觉单词在待描述图像中出现的频率，得到用以描述待描述图像的直方图矢量。

现有技术提供的前述基于词袋模型的图像描述方法在将特征点映射为视觉单词的步骤中，是选取码书中、与特征点之间的距离最近的视觉单词作为最佳方案。这样，当码书中有多个单词与特征点之间的距离相似时，有可能与特征点之间的距离稍大的视觉单词在语义上更接近该特征点，从而使得图像描述不准确。

发明内容

本发明的目的在于提供一种基于词袋模型的图像描述方法，旨在解决现有技术提供的基于词袋模型的图像描述方法在将特征点映射为视觉单词时，选取与特征点之间距离最近的视觉单词作为最佳方案，会使得图像描述不准确的问题。

本发明是这样实现的，一种基于词袋模型的图像描述方法，所述方法包括以下步骤：

从待描述图像中提取特征点；

计算所述特征点与码书中视觉单词之间的距离集合，并通过高斯隶属度函数、利用所述距离集合获得所述特征点与所述视觉单词之间的隶属度集合；

利用所述隶属度集合，统计用于描述每一特征点的所述视觉单词的隶属度，形成直方图矢量，所述直方图矢量用以描述所述待描述图像。

本发明的另一目的在于提供一种基于词袋模型的图像描述系统，所述系统包括：

提取模块，用于从待描述图像中提取特征点；

隶属度集合生成模块，用于计算所述提取模块提取出的所述特征点与码书中视觉单词之间的距离集合，并通过高斯隶属度函数、利用所述距离集合获得所述特征点与所述视觉单词之间的隶属度集合；

图像描述生成模块，用于利用所述隶属度集合生成模块获得的所述隶属度集合，统计用于描述每一特征点的所述视觉单词的隶属度，形成直方图矢量，所述直方图矢量用以描述所述待描述图像。

本发明提供的基于词袋模型的图像描述方法及系统是在现有技术基础上应用模糊理论，在得到距离集合后，利用高斯隶属度函数为每一视觉单词分配不同的隶属度，以将距离集合转换为模糊集合，之后用具有不同隶属度的视觉单词对特征点进行编码，从而有效降低传统方法引起的信息丢失问题，进而提高图像描述的准确度。

附图说明

图1是本发明提供的基于词袋模型的图像描述方法的流程图；

图2是本发明中，从待描述图像中提取特征点的步骤的详细流程图；

图3是本发明中，获得隶属度集合的步骤的详细流程图；

图4是本发明提供的基于词袋模型的图像描述系统的结构图；

图5是图4中提取模块的结构图；

图6是图4中隶属度集合生成模块的结构图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本发明进行进一步详细说明。应当理解，此处所描述的具体实施例仅仅用以解释本发明，并不用于限定本发明。

针对现有技术存在的问题，本发明提出一种基于词袋模型的图像描述方法及系统。该方法及系统是在现有技术基础上应用模糊理论，在得到距离集合后，利用高斯隶属度函数，将距离集合转换为模糊集合。

图1示出了本发明提供的基于词袋模型的图像描述方法的流程，包括以下步骤：

S1：从待描述图像中提取特征点。

本发明中，可采用尺度不变特征转换(Scale-Invariant Feature Transform，SIFT)算法或任一种SIFT改进算法实现特征点的提取。如图2所示，若采用SIFT算法实现特征点的提取，则可包括以下步骤：

S11：利用高斯核对待描述图像进行尺度变换，获得待描述图像在多尺度下的尺度空间表示序列，对尺度空间表示序列进行特征提取，以确定待描述图像中特征点的位置和所在尺度。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳大学，未经深圳大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201410491596.X/2.html，转载请声明来源钻瓜专利网。

上一篇：断路器计数装置
下一篇：网络设备及用于网络设备的管理网口配置方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于词袋模型的图像描述方法及系统有效

专利文献下载