[发明专利]基于内容的图片搜索方法及其并行优化技术无效
| 申请号: | 201010104789.7 | 申请日: | 2010-02-03 |
| 公开(公告)号: | CN102141994A | 公开(公告)日: | 2011-08-03 |
| 发明(设计)人: | 苗乾坤 | 申请(专利权)人: | 苗乾坤 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 230027 安徽省合肥*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 内容 图片 搜索 方法 及其 并行 优化 技术 | ||
技术领域
本发明涉及互联网图片搜索引擎和并行优化技术,特别是涉及基于图片本身内容的图片高效搜索方法。
背景技术
随着大容量存储器和数字化图像设备(摄像机、照相机)的普及,每天都会产生大量的不同类型的图片,例如科学,医学,地理,生活等等。如何对这些海量的图片进行有效的检索,进而便于人们有效的浏览、搜索、管理自己感兴趣的图片,是目前急需解决的一个问题。
目前商用的图片搜索引擎有谷歌图片搜索和百度图片搜索。这些以后的搜索系统都是基于关键字和图片标签的。基于关键字的图片视频检索有着其本质的缺点。图片中内容丰富,仅用几个关键字或数句话很难表达清楚,而且不同的人对图片有不同的理解,导致同一幅图片可能会有相差很大的说明。图片的数量呈爆炸式的增加,很多图片只有很少的文字信息或者根本就没有说明文字,想要高效地索引这些图片就需要人们手工的添加标签和说明文字,对于海量的图片这是非常繁重的工作。
图片搜索系统通常涉及到比较大的数据量和计算量,计算机的处理速度严重制约着图片搜索系统的能力和发展。随着多核处理器的出现和普及,通用处理器的计算能力大大加强,为进一步提高图片搜索系统的质量和速度提供了可能。多核处理器指的是在一颗处理器芯片中集成两个或多个完整的计算内核,从而提高计算能力。多核的概念最早是由IBM、HP、Sun等支持RISC架构的高端服务器厂商提出的,主要运用于服务器上。最近,在Intel和AMD的推广下,多核处理器在台式机上得到了广泛的应用。目前Intel已推出了四核处理器,更多核的处理器也将在不久面世。多核处理器,较之以前的单核处理器,能带来更多的性能。
发明内容
本发明的目的就是为了克服当前基于文本的图片搜索引擎的局限性,充分发挥多核处理器的计算潜力,提供一种基于内容的图片搜索方法,并针对多核处理器的特点提供并行优化方法。本发明能够快速、准确地向公众提供相似图片搜索服务。
根据本发明的一个目的,提出一种基于内容的图片搜索方法,用户可以提交想要查询的图片,图片搜索系统返回给用户与之视觉上相似的图片,即以图搜图,包括前端和后端两部分,前端负责用户界面,包括用户的输入和搜索结果呈现;后端负责图片颜色和边缘特征的提取,数据库图片建立索引,待搜索图片和数据库中图片的相似度计算,图片间相似度排序。
根据本发明的另一个目的,提出了图片搜索系统在多核处理器上的并行优化方法,主要包括优化系统的访存行为,采用高效的数据结构,采用SIMD指令有效优化向量操作,挖掘图片搜索系统中并行性,均衡每个核上的任务负载,减少多个核之间数据同步开销,绑定每个线程到一个固定的核以减少上下文切换开销。通过针对多核处理器的优化,来提高基于内容的图片搜索引擎的响应速度,提升用户体验。
所述的用户是指图片搜索引擎的使用者;所述的用户输入是指用途提交的待查询图片;所述的搜索结果是指数据库中与用户提交的带查询图片比较相似的图片;所述的数据库是指图片搜索引擎系统中已存在的图片集合;所述的图片特征是指图片颜色直方图和图片边缘梯度直方图;所述的相似度是指待查询图片和数据库中图片特征向量间的距离;所述的图片可以是各种互联网上存在的图片格式;所述的多核处理器是指目前普遍应用的桌面计算机和服务器;所述的SIMD指令是指现代处理器普遍支持的单指令多数据流技术。
与现有技术相比,本发明具有以下优点:
(1)本发明以图搜图,更加符合普通用户的视觉习惯。
(2)优化了搜索系统关键部分,提高了在多核处理器上的搜索速度。
附图说明
图1是基于内容的图片搜索系统流程图。
具体实施方式
下面结合附图,详细介绍本发明基于内容的图片搜索方法及其并行优化方法。本发明整个图片搜索过程分为:后端处理和前端的查询过程,如图1所示。原始图片通过特征提取、降维和索引得到一个索引后的查询数据库。用户输入一张包含自己想要查询内容的图片,系统抽取查询图片的特征得到特征向量,然后用和后端图片处理相同的方法进行降维,用降维后的向量到索引数据库中查找最匹配的若干张图片,按相似度进行排序,最终系统把排好序的图片呈现给用户,完成一次查询过程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苗乾坤,未经苗乾坤许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010104789.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:多功能车载多媒体系统及实现方法
- 下一篇:机器人
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法





