[发明专利]一种基于词袋模型的图像描述方法及系统有效
| 申请号: | 201410491596.X | 申请日: | 2014-09-23 |
| 公开(公告)号: | CN104299010B | 公开(公告)日: | 2017-11-10 |
| 发明(设计)人: | 李岩山;谢维信;黄庆华;李晓棠;高志坚 | 申请(专利权)人: | 深圳大学 |
| 主分类号: | G06K9/66 | 分类号: | G06K9/66 |
| 代理公司: | 深圳市恒申知识产权事务所(普通合伙)44312 | 代理人: | 陈健 |
| 地址: | 518060 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 模型 图像 描述 方法 系统 | ||
1.一种基于词袋模型的图像描述方法,其特征在于,所述方法包括以下步骤:
从待描述图像中提取特征点;
计算所述特征点与码书中视觉单词之间的距离集合,并通过高斯隶属度函数、利用所述距离集合获得所述特征点与所述视觉单词之间的隶属度集合;
利用所述隶属度集合,统计用于描述每一特征点的所述视觉单词的隶属度,形成直方图矢量,所述直方图矢量用以描述所述待描述图像;
其中,所述计算所述特征点与码书中视觉单词之间的距离集合,并通过高斯隶属度函数、利用所述距离集合获得所述特征点与所述视觉单词之间的隶属度集合的步骤包括以下步骤:
计算所述特征点与所述视觉单词之间的距离集合;
通过高斯隶属度函数、利用所述距离集合获得每一特征点与各视觉单词之间的隶属度,得到第一模糊集合;
其中,所述第一模糊集合作为所述隶属度集合,所述计算所述特征点与所述视觉单词之间的距离集合的步骤表示为:
其中,所述di,j是所述特征点和相应的所述视觉单词之间的欧式距离,所述D为用以表示所述距离集合的矩阵,所述n为所述特征点的数量,所述m为所述视觉单词的个数;
所述通过高斯隶属度函数、利用所述距离集合获得每一特征点与各视觉单词之间的隶属度,得到第一模糊集合的步骤表示为:
其中,所述θj是所述视觉单词的高斯模型的期望值,所述σj是所述视觉单词的高斯模型的方差。
2.如权利要求1所述的基于词袋模型的图像描述方法,其特征在于,所述从待描述图像中提取特征点的步骤包括:
利用高斯核对待描述图像进行尺度变换,获得所述待描述图像在多尺度下的尺度空间表示序列,对所述尺度空间表示序列进行特征提取,以确定所述待描述图像中特征点的位置和所在尺度;
通过拟合三维二次函数精确确定所述特征点的位置和尺寸;
利用所述特征点邻域像素的梯度方向分布特性,为每一特征点指定一主方向和多个辅方向;
统计所述特征点所处尺度和区域的图像梯度,并通过转换得到所述特征点的特征向量。
3.如权利要求1所述的基于词袋模型的图像描述方法,其特征在于,在所述得到第一模糊集合的步骤之后,所述方法还包括以下步骤:
去除所述第一模糊集合中、与所述特征点之间的距离超过相应阈值时的隶属度,得到第二模糊集合,所述第二模糊集合作为所述隶属度集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410491596.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:断路器计数装置
- 下一篇:网络设备及用于网络设备的管理网口配置方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





