[发明专利]基于哈希值比较的文件上传在审

专利信息
申请号: 201280068717.9 申请日: 2012-04-16
公开(公告)号: CN104067259A 公开(公告)日: 2014-09-24
发明(设计)人: D.P.比尔迈尔;J.C.霍尔;A.C.巴克莱;J.M.克伦;H.H.亚马莫托 申请(专利权)人: 惠普发展公司;有限责任合伙企业
主分类号: G06F15/16 分类号: G06F15/16;G06F17/40
代理公司: 中国专利代理(香港)有限公司 72001 代理人: 吕传奇;徐红燕
地址: 美国德*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 哈希值 比较 文件 上传
【说明书】:

背景技术

随着用户已经适应经由多种计算设备来访问其数据,可能期望将用户的数据文件存储在存储系统中,该存储系统允许从任何用户设备且经由网络连接从任何位置访问文件。此类分布式存储可用来存储用户对从多个设备和/或位置访问感兴趣或对降低由于对本地化存储的损害而引起的文件丢失风险感兴趣的相对大的媒体文件,诸如音乐文件或视频文件。因此,需要存储资源来存储用于大量用户的媒体及其他文件,并且用来将文件上传到分布式储存器的网络资源可以是广泛的。

附图说明

针对本发明的各种示例的详细描述,现在将对附图进行参考,在所述附图中:

图1A示出了根据本文公开的原理的针对用于存储并向远程计算设备传送文件的系统的框图;

图1B示出了根据本文公开的原理的针对可用于存储并传送文件的计算设备的框图;

图2示出了根据本文公开的原理的针对用于存储并向远程计算设备传送文件的方法的流程图;

图3示出了根据本文公开的原理的针对用于上传文件到服务器系统的方法的流程图;以及

图4示出了根据本文公开的原理的针对用于传送文件到远程计算设备的方法的流程图。

注释和命名法

特定术语遍及以下描述和权利要求被用来指代特定系统部件。如本领域的技术人员将认识到的,计算机公司可以用不同的名称来指代部件。本文档并不意图对在名称而不是功能方面不同的部件进行区别。在以下讨论中和权利要求中,以开放方式来使用术语“包括”和“包含”,并且因此应将其解释为意指“包括但不限于”。并且,术语“耦合”意图意指间接、直接、光学或无线电气连接。因此,如果第一设备耦合到第二设备,则该连接可以是通过直接电气连接、通过经由其他设备和连接的间接电气连接、通过光学连接或通过无线电气连接。此外,术语“软件”包括无论用来存储软件的介质如何、都能够在处理器上运行的任何可执行指令。因此,存储在存储器(例如,非易失性存储器)中且有时称为“嵌入式固件”的代码被包括在软件的定义内。叙述“基于”意图意指“至少部分地基于”。因此,如果X是基于Y,则X可基于 Y和任何数目的附加因素。

具体实施方式

以下讨论针对使用哈希值比较来减少存储在系统上的文件数目的分布式存储系统的各种示例。不应将公开的示例解释为或以其他方式用作限制本公开的范围,包括权利要求。另外,本领域的技术人员将理解的是以下描述具有宽泛的应用,并且任何示例的讨论并不意图暗示本公开的范围、包括权利要求局限于该示例。

由于对于大量(例如数百万)用户而言可使用分布式存储系统来存储大型文件,诸如媒体文件,所以期望在不减少存储在系统上的内容量的情况下减少由存储系统存储和/或传输到存储系统的文件的数目。本文公开的分布式存储系统将针对用户所拥有的文件的内容部分计算的哈希值与针对存储系统存储的文件计算的哈希值相比较以确定与用户所拥有文件匹配(例如,相同)的文件是否已被存储在存储系统上。如果哈希值比较识别到存储系统上的匹配文件,则不需要将用户所拥有文件上传到存储系统,减少系统所消耗的储存器和带宽。

该哈希值可基于文件的已编码符号的哈希(hash)(例如,MP3编码、MPEG-4编码等)。如果哈希值比较未能识别到存储系统上的匹配文件,则可将用户所拥有文件的内容部分(例如,音频或视频部分)的指纹(fingerprint)与存储在分布式存储系统上的主文件许可的指纹相比较。该指纹是基于已解码文件信号(即,音频信号、视频信号等)的标记。例如,因为音频信号的不同编码的重放可能会产生等效的音频认知,所以音频指纹可以基于音频信号是如何被报头而不是信号编码认知的。因此,指纹未受到可引起哈希值错误比较的编码格式、比特率、编码错误等方面的差异的影响。GRACENOTE公司的MUSICID是音频指纹系统的一个示例。然而,对文件采指纹可能需要承担哈希比较避免的不期望的许可费用。如果指纹比较识别到存储系统上的等效文件,则不需要将用户所拥有文件上传到存储系统,否则将用户所拥有的文件上传到存储系统。

图1A示出了根据本文公开的原理的针对用于存储并向远程计算设备传送文件的系统100的框图。系统100包括服务器系统102、计算设备120—124以及将服务器系统102通信耦合到计算设备120—124的网络118。计算设备120-124可以作为服务器系统102的客户端。网络118是能够将计算设备120—124通信耦合到服务器系统102的任何网络。例如,网络118可以是局域网、广域网、城域网、因特网或其组合。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于惠普发展公司;有限责任合伙企业,未经惠普发展公司;有限责任合伙企业许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201280068717.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top