[发明专利]一种适用于移动终端的视觉搜索方法在审
申请号: | 201310483155.0 | 申请日: | 2013-10-16 |
公开(公告)号: | CN103530649A | 公开(公告)日: | 2014-01-22 |
发明(设计)人: | 桂振文;刘越;王涌天 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/30 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 仇蕾安;李爱英 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 适用于 移动 终端 视觉 搜索 方法 | ||
技术领域
本发明属于移动增强现实技术领域,具体涉及一种适用于移动终端的视觉搜索方法。
背景技术
视觉搜索的研究目标在于利用计算机代替人自动去处理海量的物理信息,识别各种不同模式的目标和对象,从部分上代替人的脑力劳动,也可拓展人类生理器官所不能胜任的领域,在遥感图像处理、医学图像处理和增强现实等领域有着广泛的应用。
目前,随着互联网的发展,人类正在步入一个信息化的社会,互联网已经成为人类发布、获取、交换信息的重要平台。互联网上信息量的指数级增长,使得如何让用户能够快速准确地在海量的数据中找到其所需信息成为了一个重要的课题。近些年来,照相机,智能手机,PAD,摄像机等电子产品的普及,我们可以随时随处,拍下我们喜欢的景色,动物,食品等等各种各样的图片。截止到2010年1月,Facebook声称其网站上的图片数量已经超过250亿张。面对如此海量的图片资源,如何快速准确的找到我们感兴趣的图片是必须要解决的问题,是商业界和学术界的一个重要研究方向。然而,随着图片规模的极大增长,要保证图像搜索的实时性,相应的图像编码、图像检索技术和数据库索引技术也必须做相应的调整或加速。
同时计算机软、硬件技术的迅猛发展,为增强现实技术走出室内应用进而支持复杂的分析、决策和管理打下了坚实的基础。一些移动终端设备(像PDA、智能手机等)的功能也越来越丰富,并且拥有了嵌入式操作系统、触摸屏、GPS定位、视频摄像头等功能,同时也具备了较强的计算和处理能力。这些功能的集成为开发基于移动终端的增强现实系统奠定了基础。据有关资料,截止到2010年我国移动电话用户可达7.4亿,其中拥有智能手机的用户占了相当的比重,智能手机作为增强现实的应用平台将具有很大的应用潜力。3G网的逐步开通、运行,意味着移动增值业务全新时代的开始,增强现实技术和LBS相结合可以实现信息的实时交互、三维动态显示,可使人机界面更加友好和具有智能性。
基于上述分析,结合具有摄像头,GPS传感器和无线网络传感器的终端以及服务器端的图像识别和匹配技术,可以将场景之类的大规模物体的在线识别变为可能。
然而以前的许多图像识别的研究工作都是在样本规模不是非常大的情况下考虑图像检索问题,许多方法也不能推广到更大规模的图像识别问题,系统性能和能够处理的数据规模存在局限性。当城市级规模的数据,以百万为单位时,图像识别系统需要海量的存储空间和海量数据的快速计算能力。因为图像本身需要很大的空间存储,从图像提取的各种特征描述向量也需要大量的空间存储。同时,在图像识别和匹配过程中对描述符索引、匹配也需要强大计算能力。
发明内容
有鉴于此,本发明提供了一种适用于移动终端的视觉搜索方法,利用该方法能够实现在线海量图像的识别,从而达到在线视觉搜索的目的,同时该方法大大减少了数据存储量,提高了图像识别率和视觉搜索的速度。
实现本发明的技术方案如下:
一种适用于移动终端的视觉搜索方法,适用于该方法的样本图像库满足两个条件:①样本图像库中的每一样本图像带有GPS信息,②样本图像库中的每一样本图像采用二进制局部特征向量表示;该方法的具体过程为:
步骤1:利用移动终端采集当前场景的待识别图像,并获取采集图像时移动终端的重力方向和当前场景的GPS信息;
步骤2:采用二进制局部特征检测算法BRISK对待识别图像进行特征点检测,得到待识别图像的特征点;根据所述重力方向,用特征描述符FREAK对所述特征点进行描述,获得待识别图像的二进制局部特征向量;
步骤3:将所述GPS信息和二进制局部特征向量打包成一描述符文件,并将其发送出去;
步骤4:服务器接收到描述符文件后,从该描述符文件中提取GPS信息,从样本图像库中查找与所提取的GPS信息相距最近的GPS信息所对应的图像,并将其定义为查询图像;
步骤5:将待识别图像与查询图像的二进制局部特征向量进行一一匹配,寻找与待识别图像最相近的查询图像,并将其对应的信息传输至移动终端,实现视觉搜索。
进一步地,本发明在对待识别图像特征点检测之前,还包括对图像进行降采样处理。
进一步地,本发明在步骤3生成的描述符文件还进一步包括二进制局部特征向量个数,且GPS信息和二进制局部特征向量个数放在描述符文件的开头。
进一步地,本发明所述匹配为:通过计算待识别图像和查询图像的二进制特征向量的汉明距离,基于汉明距离寻找与待识别图像最相近的图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310483155.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:射频系统中电子标签的天线限幅电路
- 下一篇:喷粉瓶