[发明专利]一种基于多特征签名的海量图像检索方法无效
申请号: | 201010176213.1 | 申请日: | 2010-05-13 |
公开(公告)号: | CN101859320A | 公开(公告)日: | 2010-10-13 |
发明(设计)人: | 金城;朱远毅;薛向阳 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;盛志范 |
地址: | 20043*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于图像处理与信息检索技术领域,具体为一种基于多特征签名的图像检索方法。该方法包含以下步骤:提取图像的多种特征;对特征降维并做比特映射,得到各种特征对应的特征签名;对特征签名建立索引;以汉明距离表示特征签名之间的距离;通过特征签名查找与查询图片内容相近的图片。本发明方法,可以很好地解决图像的特征存储与距离计算,同时具有较高的查询准确率和系统可扩展性。 | ||
搜索关键词: | 一种 基于 特征 签名 海量 图像 检索 方法 | ||
【主权项】:
1.一种基于多特征签名的图像检索方法,其特征在于,用主分量分析降低图像特征的维数,并利用矢量量化技术在主分量分析的基础上,进一步将图像特征量化到二值矢量表示的特征签名上;将该特征签名存入一个或多个整数中;用汉明距离表示特征之间的距离,通过图像的多种特征检索图像,包括以下步骤:步骤一、图像的多特征提取首先提取图像的多种特征,得到多维的浮点矢量;经过上述多种特征提取后,得到m种以浮点矢量表示的图像特征:F1,F2,...,Fm,它们对应的矢量维度分别为dim1,dim2,...,dimm;步骤二、特征降维首先对每一种特征Fi降维,在维持基本性质的情况下将Fi从dimi维降至K维的特征Gi,这通过PCA实现:Gi=AiFi;这里Ai表示第i种特征对应的降维投影矩阵,Ai由大规模的图像样本训练得到,同时得到训练样本在该特征上的均值矢量Mi=(m1,m2,...,mk)T,其中的元素mj是训练样本在第j个维度上的均值;另外还得到2个矢量:
和![]()
是训练样本在第j个维度上,大于mj的元素的均值,
是训练样本在第j个维度上,小于mj的元素的均值;步骤三、特征映射与编码借助PCA训练过程中得到的每种特征Fi所对应的3个矢量:Mi,
和
对降至K维后的浮点特征矢量Gi再进行比特映射和编码,映射至K维的二值矢量Hi;对Gi的高h维分量做2位比特映射,对Gi的第h维至第h+K-2h维,即第h维至第K-h维做1位比特的映射;这样Hi的高2h维来自Gi的高h维,Hi的低K-2h维来自Gi的中间K-2h维,Gi的最低h维,在映射过程中被忽略;步骤四、对特征签名建立索引得到所有图像的多特征签名后,对每一类特征签名进行聚类:采用AP聚类方法,把所有图像的特征签名i聚成Gi个类,每个类的类中心为centeri,k 1≤k≤Ci,第i种特征生成一个从特征签名到图像id的倒排索引;索引的键为特征签名,每个键对应一条图像id的拉链,并且通过Ci个类中心优化查询;步骤五、通过多特征签名查找与查询图片内容相近的图片在检索阶段,先对用户提交的图像进行多特征签名计算,获得查询图像的各种特征签名sign1,sign2,...,signm,方法与特征签名计算阶段相同;接着通过签名signi,在索引中找到与其最接近的类中心centeri,k和centeri,k对应的倒排表;查找倒排表中的特征签名,找到与signi汉明距离小于阈值Ti的所有特征签名,取出且合并所有的图像id,得到链表idlisti;待所有特征的链表计算完成后,归并得到以图像id链表形式的查询结果idlist;从存储系统中根据图像id即可找到图像,最终返回给用户。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010176213.1/,转载请声明来源钻瓜专利网。