[发明专利]基于词汇树检索与相似度验证的云端图像识别方法在审

申请号：	201710073040.2	申请日：	2017-02-10
公开（公告）号：	CN106874445A	公开（公告）日：	2017-06-20
发明（设计）人：	施茂燊	申请（专利权）人：	深圳前海大造科技有限公司
主分类号：	G06F17/30	分类号：	G06F17/30
代理公司：	成都行之专利代理事务所(普通合伙)51220	代理人：	田甜
地址：	518000 广东省深圳市前海深港合作区前***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于词汇检索相似验证云端图像识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明涉及图像识别技术领域，具体涉及一种基于词汇树检索与相似度验证的云端图像识别方法。

背景技术

实时图像搜索是一种可以支持用户自定义的，超大规模的图像数据库的实时图像识别技术。它可以实现对移动端设备的图像输入内容进行实时的识别。整个识别过程是在云端进行的，这样可以使用户无需将庞大的图像数据库下载到本地，并且也可以充分地利用云端计算资源对数据库进行高速的检索。

然而，目前基于云端的实时图像识别技术其通过上传本地图片到服务器，服务器将带识别的图片与存储的图片逐一进行比较，其存在以下缺陷：在无线网络较差的情况下，用户实时上传图像的速度会受到很大影响。

发明内容

本发明为了解决上述技术问题提供一种基于词汇树检索与相似度验证的云端图像识别方法。

本发明通过下述技术方案实现：

基于词汇树检索与相似度验证的云端图像识别方法，包括以下步骤，

图像获取步骤：获取目标图像，并对目标图像使用ORB算法提取所有ORB特征点，并对每一个ORB特征点生成相应的描述子，生成目标图像的ORB描述子序列；

图像上传步骤：将该ORB描述子序列上传到基于描述子样本的云端图像数据库中；

图像识别步骤：云端图像数据库利用基于词汇树的检索算法对图像进行匹配识别并返回匹配度靠前的N张候选图像，其中N为大于1的自然数；

相似度验证步骤：在云端图像数据库中找到候选图像，得到目标图像和候选图像的128维向量，分别计算目标图像与各候选图像之间的距离，并找出距离最短的候选图像。

本发明通过提取目标图像的ORB特征点以生成ORB描述子序列，并将ORB描述子序列上传至基于描述子样本的云端图像数据库中进行检索匹配，相比于上传目标图像的方式，描述子的数据量小，减小对网络的要求，即网络较差对识别的速度影响小。利用词汇树检索算法找出匹配度靠前的N张图像后利用目标图像和候选图像之间的距离进行相似性验证，该相似性验证为小规模的，即可保证快速检索，也极大的提高了检索的精度。

所述云端图像数据库的生成方法包括以下步骤：

描述子生成步骤：收集图片，提取每张图片的ORB特征点，并对每个ORB特征点生成相应的描述子以得到描述子样本；

树状模型生成步骤：根据描述子样本生成图像数据库的树状模型；

数据库生成步骤：向树状模型中添加图片，建立树状结构的图像数据库。

现有的图像匹配是图像和图像之间的匹配，检索的时间的增加随着图像的增加线性增长。一个特征描述子到数据库里匹配所有特征描述子，数据库里的描述子越多，匹配的时间就越长，因为暴力匹配是一一匹配，最后寻找距离最短的匹配组。在保证一定准确度的前提下，其检索速度和广度存在矛盾，这两点都与云端图像数据库的大小密切相关。而采用上述方法，由于数据库中的描述子已经进行树状分类，在进行匹配的时候，待匹配的描述子会寻找与其最相似的分支，而不需要遍历真个数据库，即树状检索结构可以让待匹配的特征描述子不用一一匹配所有的描述子，检索时间主要跟经过的节点数有关系，数据库中的描述子多不代表检索经过的节点数越多。所以检索时间不是按数据库的大小线性增加，而是对数增长，解决检索广度与速度之间的矛盾。而对于新加入图像描述子会加入相应的分支，而不是单纯的增加，因此在广度上也能很好的解决大数据库的检索情况。

所述描述子生成步骤具体为：收集图片，分别对每张图片进行缩放以建立一个图像金字塔，对图片的各个尺度使用ORB算法提取所有ORB特征点，并对每一个ORB特征点生成相应的描述子。

所述树状模型生成步骤为：利用描述子之间的欧式距离作为判据，对描述子样本用K-means算法做聚合分类，生成图像数据库的树状模型。

所述树状模型生成步骤具体为：

A1、定义一个树状结构，其最大层数为L，每层最大子节点数为K；

A2、对描述子样本用K-means算法做聚合分类，得到子节点分类结果，将每个子节点内所有描述子的平均描述子作为该子节点的描述子；

A3、若该子节点内描述子样本的数量大于K的两倍，则对该子节点内的描述子样本作进一步的K-means分类，重复该步骤，直至树状结构的最大层数小于等于L或者没有子节点的描述子样本数量大于K的两倍；

A4、对所有的子节点依次排序标号，生成图像数据库的树状模型。

所述数据库生成步骤为：

B1、给图片一个唯一的编号；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳前海大造科技有限公司，未经深圳前海大造科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】