[发明专利]一种用于Hadoop分布式环境的图像索引结构有效

专利信息
申请号: 201310583105.X 申请日: 2013-11-20
公开(公告)号: CN103577604B 公开(公告)日: 2018-07-06
发明(设计)人: 董乐;林智煜;封宁;梁燕 申请(专利权)人: 电子科技大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 成都华风专利事务所(普通合伙) 51223 代理人: 徐丰;杨保刚
地址: 611731 四川省成*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数量减少 图像索引 分布式环境 索引模块 图像文件数据 分布式系统 存储空间 任务调度 数据文件 索引结构 索引文件 图像处理 图像文件 系统瓶颈 大文件 偏移量 小文件 集合 图像
【说明书】:

发明公开了一种用于Hadoop分布式环境的图像索引结构,该图像索引结构包括索引模块和解析模块,所述索引模块含有一个用于存放图像文件ID和偏移量的索引文件和一个用于存放所有图像文件数据的数据文件。本发明通过将大量图像小文件集合到一个大文件中,并且加入了索引结构,通过使用分布式系统进行处理时,解决了海量图像处理开销大且效率低下的问题;文件数量减少之后,系统节省大量管理所需存储空间;文件数量减少之后,任务调度的资源也将减少;文件数量减少之后,启动任务也将变少,达到系统瓶颈的机会大大减少。

技术领域

本发明涉及图像数据检索技术领域,尤其涉及一种用于Hadoop分布式环境的图像索引结构,其在Hadoop分布式环境下对索引文件进行解析,读取数据文件中的图像数据用于Hadoop Mapreduce框架处理。

背景技术

目前,随着互联网的广泛普及和多媒体技术的飞速发展,多媒体在互联网流量中所占的比重越来越高,尤其是基于图像处理的应用服务已经渐渐取代了传统的文字信息应用。在图像处理领域,由于数字图像处理数据量较大,复杂度高,传统的单机处理已经达到了明显的瓶颈,使用并行处理无疑是一个好的解决方案。

针对目前网络上大部分数据信息都有对应的图像的情况,目前也有一些技术提出:用户在进行信息搜索时,可以以图像作为其输入的内容,从而基于用户输入的图像,通过获取该图像所包含的与图像相关的信息(以下简称图像信息),就可以从图像库中搜索具备与获取的图像信息相匹配的图像信息的图像以克服基于关键词的信息检索方法存在的上述弊端。

与基于关键词的信息检索方法需要以生成信息索引为前提类似,基于图像的信息检索方法也需要针对图像库中海量的图像生成索引,从而为后续的检索流程提供数据支持。现有技术中,传统的基于图像的信息检索技术,针对图像库中的图像生成图像索引时主要采用的是依据图像的文件名(或其他针对图像的文字描述信息)的方式,该方式的实现前提是需要操作人员手工为图像添加相应的文字描述信息。基于手工添加文字描述信息的方式生成图像索引的缺陷在于:图像库中的图像数量往往非常庞大,基于手工添加文字描述信息的方式生成图像索引势必导致耗费较多的处理资源。并且,由于操作人员在添加文字描述信息时难免带入自身对于图像的一些主观感受,从而上述图像索引生成方式还可能存在生成的图像索引在一定程度上受到操作人员主观感受的影响从而准确性不高的问题。

Hadoop 是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop是高效的,因为以并行的方式工作,通过并行处理加快处理速度。Hadoop 还是可伸缩的,能够处理 PB 级数据。此外,Hadoop 可依赖于社区服务器,因此它的成本比较低,任何人都可以使用。

Hadoop同时是一个能够让用户轻松架构和使用的分布式计算平台。用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。它主要有以下几个优点:

(1).高可靠性:Hadoop按位存储和处理数据的能力值得人们信赖。

(2).高扩展性: Hadoop是在可用的计算机集簇间分配数据并完成计算任务的,这些集簇可以方便地扩展到数以千计的节点中。

(3).高效性: Hadoop能够在节点之间动态地移动数据,并保证各个节点的动态平衡,因此处理速度非常快。

(4).高容错性: Hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310583105.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top