[发明专利]一种获得图像表示的方法和装置在审
申请号: | 201810372629.7 | 申请日: | 2018-04-24 |
公开(公告)号: | CN108563777A | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 马福强;崔利阳;薛鸿臻;刘小磊 | 申请(专利权)人: | 京东方科技集团股份有限公司;北京京东方光电科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100015 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视觉特征 图像表示 方法和装置 编码序列 视觉词典 训练图像 提取目标图像 图像检索系统 应用灵活性 简化处理 聚类分析 目标图像 图像检索 向量 | ||
本发明提供了一种获得图像表示的方法和装置。提取目标图像的第一视觉特征;根据预先获得的视觉词典对所述第一视觉特征进行编码,获得编码序列;其中,所述视觉词典为依据训练图像进行至少两次聚类分析后获得;对所述编码序列进行简化处理,获得所述目标图像的第一图像表示向量。本发明实施例充分利用了训练图像中的视觉特征,因此可以提升图像检索的精度,从而提高图像检索系统的应用灵活性。
技术领域
本发明涉及图像检索技术领域,特别是涉及一种获得图像表示的方法和装置。
背景技术
基于内容的大规模图像检索,其基本概念是给定一张图像,可以从特定图像库中检索出与给定图像相同或相似的图像或图像集合。图像检索技术已经成为一种重要的信息检索方式,商用的图像检索系统展现了极为可观的应用前景。
图像检索的主要流程包括提取图像特征,构建图像表达,判断图像相似性等。目前针对视觉特征的算法模型存在视觉特征利用不充分、检索精度不均衡等问题,影响了图像检索系统的应用灵活性。
发明内容
本发明提供一种获得图像表示的方法和装置,以解决现有技术视觉特征利用不充分的问题。
为了解决上述问题,本发明公开了一种获得图像表示的方法,所述方法包括:
提取目标图像的第一视觉特征;
根据预先获得的视觉词典对所述第一视觉特征进行编码,获得编码序列;其中,所述视觉词典为依据训练图像进行至少两次聚类分析后获得;
对所述编码序列进行简化处理,获得所述目标图像的第一图像表示向量。
可选地,所述根据预先获得的视觉词典对所述第一视觉特征进行编码,获得编码序列,包括:
根据所述第一视觉特征与所述视觉词典中视觉单词的残差向量,形成所述目标图像的编码序列,所述视觉词典中包含经过所述至少两次聚类分析获得的视觉单词。
可选地,在所述根据预先获得的视觉词典对所述第一视觉特征进行编码,获得编码序列之前,所述方法还包括:
获得所述视觉词典;
所述获得所述视觉词典,包括:
提取所述训练图像的多个第二视觉特征;
对所述多个第二视觉特征进行第一聚类分析,获得由k1个第一视觉单词构成的第一视觉词典;
根据所述第一视觉词典,分别查找各所述第二视觉特征距离最近的第一视觉单词,并确定各所述第一视觉单词对应的第一残差向量;
对各所述第一视觉单词对应的所述第一残差向量进行第二聚类分析,获得各所述第一视觉单词对应的由k2个第二视觉单词构成的第二视觉词典;
其中,k1和k2为正整数。
可选地,所述确定各所述第一视觉单词对应的第一残差向量,包括:
分别计算各所述第二视觉特征与查找到的所述第一视觉单词的残差向量;
根据计算得到的所述残差向量,确定各所述第一视觉单词对应的所述第一残差向量。
可选地,所述根据所述第一视觉特征与所述视觉词典中视觉单词的残差向量,形成所述目标图像的编码序列,包括:
根据所述第一视觉特征、所述第一视觉词典和所述第二视觉词典,得到各所述第一视觉单词对应的第一长矢量;
根据所述第一视觉词典和所述第一长矢量,得到所述目标图像的第二长矢量。
可选地,所述根据所述第一视觉特征、所述第一层视觉词典和所述第二层视觉词典,得到各所述第一视觉单词对应的第一长矢量,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东方科技集团股份有限公司;北京京东方光电科技有限公司,未经京东方科技集团股份有限公司;北京京东方光电科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810372629.7/2.html,转载请声明来源钻瓜专利网。