[发明专利]数据存储方法、数据下载方法及其装置有效
| 申请号: | 201210087144.6 | 申请日: | 2012-03-29 |
| 公开(公告)号: | CN103365865B | 公开(公告)日: | 2017-07-11 |
| 发明(设计)人: | 刘刚 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L29/08 |
| 代理公司: | 北京派特恩知识产权代理有限公司11270 | 代理人: | 张颖玲,蒋雅洁 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据 存储 方法 下载 及其 装置 | ||
1.一种数据存储方法,其特征在于,包括:
当接收到入库请求时,获取其中携带的统一资源定位符URL;
判断自身是否存储有与所述URL对应的URL模板;其中,所述URL模板与同一域名下的同一文件的不同URL对应;
当判断结果为是时,所述URL不存储到URL资源索引数据库,并结束此次入库操作;
当判断结果为否时,确定与所述URL对应的URL模板,以及所述URL对应的文件的hash值和所述URL模板的hash值,并将所述文件的hash值与所述URL模板的hash值的对应关系信息存储到所述URL索引数据库。
2.如权利要求1所述的方法,其特征在于,所述确定所述URL对应的文件的hash值,具体为:
若所述入库请求为下载客户端发送的入库请求,则获取所述入库请求中携带的文件的hash值;
若所述入库请求为资源爬虫系统发送的入库请求,则下载入库请求中携带的URL对应的文件,并确定所述文件的hash值。
3.如权利要求2所述的方法,其特征在于,所述确定URL对应的URL模板之后,还包括:存储所述URL模板,并将所述URL模板存储到URL索引数据服务器。
4.如权利要求1所述的方法,其特征在于,所述判断自身是否存储有与所述URL对应的URL模板,具体为:
当根据自身存储的需要进行模板匹配的URL对应的域名信息确定所述URL需要进行模板匹配时,判断自身是否存储有与所述URL对应的URL模板。
5.如权利要求1所述的方法,其特征在于,所述判断自身是否存储有与所述URL对应的URL模板,具体为:
当确定URL资源数据库中未存储有所述URL时,判断自身是否存储有与所述URL对应的URL模板。
6.一种基于权利要求1-5任一项所述的方法实现的数据下载方法,其特征在于,包括:URL索引数据服务器接收资源索引服务器发送的用于查询请求下载的文件的hash值的查询请求,其中携带所述请求下载的文件的URL;
所述URL索引数据服务器根据所述请求下载的文件的URL确定与所述URL对应的URL模板,并确定所述URL模板的hash值;
所述URL索引数据服务器根据所述URL模板的hash值查询对应的文件hash值,并将查询到的文件hash值返回给所述资源索引服务器,由所述资源索引服务器根据所述文件hash值获取对应的URL集合并返回给下载客户端,以使所述下载客户端根据所述URL集合进行多源下载。
7.如权利要求6所述的方法,其特征在于,所述URL索引数据服务器根据所述URL模板的hash值查询对应的文件hash值,具体为:
所述索引数据服务器向所述URL索引数据库发送文件hash值查询请求,其中携带所述文件对应的URL模板的hash值;
所述索引数据服务器接收所述URL索引数据库返回的文件hash值;其中,所述URL资源索引数据库根据接收到的URL模板hash值以及自身存储的文件hash值和URL模板的hash值的对应关系信息查询接收到的URL模板hash值对应的文件hash值。
8.一种数据存储装置,其特征在于,包括:
存储模块,用于存储URL模板;
获取模块,用于当所述数据存储装置接收到入库请求时,获取其中携带的统一资源定位符URL;
判断模块,用于判断所述存储模块是否存储有与所述URL对应的URL模板;其中,所述URL模板与同一域名下的同一文件的不同URL对应;
处理模块,用于当所述判断模块的判断结果为是时,所述URL不存储到URL资源索引数据库,并结束此次入库操作;当所述判断模块的判断结果为否时,确定与所述URL对应的URL模板,以及所述URL对应的文件的hash值和所述URL模板的hash值,并将所述文件的hash值与所述URL模板的hash值的对应关系信息存储到所述URL索引数据库。
9.如权利要求8所述的数据存储装置,其特征在于,
所述处理模块具体用于,若所述入库请求为下载客户端发送的入库请求,则获取所述入库请求中携带的文件的hash值;若所述入库请求为资源爬虫系统发送的入库请求,则下载入库请求中携带的URL对应的文件,并确定所述文件的hash值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210087144.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:粘合剂组合物以及叠层体
- 下一篇:电源控制电路及电源控制方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





