[发明专利]一种用于eMule网络的文件资源信息采集方法有效
申请号: | 201310204527.1 | 申请日: | 2013-05-28 |
公开(公告)号: | CN103354554A | 公开(公告)日: | 2013-10-16 |
发明(设计)人: | 程学旗;冯凯;刘备;田红志;王元卓;陈雷;刘悦 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | H04L29/08 | 分类号: | H04L29/08 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 emule 网络 文件 资源 信息 采集 方法 | ||
技术领域
本发明涉及计算机网络技术领域,具体地说,本发明涉及一种用于eMule网络的文件资源信息采集方法。
背景技术
eMule网络是一种典型的P2P网络,其特点是每个客户都可以与网络中其他客户共享自己的文件资源。eMule网络中的节点数量巨大,同时传播的资源数量更是数以亿计,大大方便了人们共享和获取资源。
当前,Kademlia协议已成为eMule网络中实现资源共享的一项重要协议,它是美国纽约大学Petar Maymounkov和David Mezieres在2002年发表的一项研究成果。Kademlia是一种分布式哈希表(Distributed Hash Table,DHT)技术,通过独特的异或(XOR)算法为距离度量基础,建立了一种全新的DHT拓扑结构,与其他算法相比大大提高了路由查询速度。在KAD网络(支持Kademlia协议的eMule网络)中,任何一个KAD节点都可以方便地进行资源发布,所发布的<key,value>数据存放在其它KAD节点上,并可以被需要获取该资源的节点按照一定规律查找得到,从而大大方便了人与人之间的资源共享。但与此同时,庞大的eMule网络也不可避免地传播着一些不良信息和非法资源,而由于索引信息被分散存储于全网的客户端中,监管者往往难以全面掌握整个eMule网络的文件资源信息和文件资源的传播状况,这样就难以发现和有效干预不良信息和非法资源的传播,导致监管出现较大的漏洞。
目前尚没有对eMule网络全网范围的文件资源信息采集方面的研究被公开,因此,当前迫切需要一种能够全面掌握eMule网络的文件资源信息的解决方案。
发明内容
本发明的目的是提供一种能够全面掌握eMule网络的文件资源信息以便于对eMule网络进行监管的解决方案。
为了实现上述发明目的,本发明提供了一种用于eMule网络的文件资源信息采集方法,包括下列步骤:
1)初始化文件集合;
2)遍历所述文件集合,对于每个文件,搜索共享过该文件的活跃客户端的地址信息,得到活跃客户端集合;
3)对于活跃客户端集合中的每个活跃客户端,探测该活跃客户端所共享的文件列表;
4)根据所探测的活跃客户端所共享的文件列表,更新所述文件集合,返回执行步骤2);
重复执行所述步骤2)~4),得到文件索引表,该文件索引表中记录出现在所述文件集合中的每个文件及其对应的活跃客户端地址信息。
其中,所述步骤2)中,遍历过程包括下列子步骤:
21)取出文件集合中的一个资源文件作为当前文件,获取当前文件的哈希值;
22)使用文件哈希值在eMule网络中进行搜索,得到共享过该当前文件的客户端的地址信息;
23)判断步骤22)所得到的共享过该当前文件的客户端是否为活跃客户端。
其中,所述步骤22)还包括,在使用文件哈希值在eMule网络中进行搜索,得到共享过该当前文件的客户端的地址信息的同时,获得该客户端的其它节点信息。
其中,所述步骤22)中,所述客户端的地址信息包括IP地址、UDP端口号和TCP端口号。
其中,所述步骤22)中,所述客户端的其它节点信息包括节点哈希值。
其中,所述步骤23)包括下列子步骤:
231)基于步骤22)所获得的地址信息,对共享过所述当前文件的客户端进行监听;
232)模拟eMule客户端,向共享过当前文件的节点发送PING消息;
233)判断是否收到共享过当前文件的节点返回的PONG消息,若收到,则记录返回PONG消息的节点的地址信息并将相应的客户端标记为活跃客户端;否则,判断相应的客户端为非活跃客户端。
其中,所述步骤3)中,探测该活跃客户端所共享的文件列表的过程 包括下列子步骤:
31)获取活跃客户端的地址信息,将其作为目的地址;
32)获取该活跃客户端的共享文件目录并将其作为目标目录;
33)基于当前的目标目录,模拟eMule客户端向目的地址发送ASKSHAREDFILES消息;
34)监听ASKSHAREDFILESANSWER消息,并记录所有共享文件列表及文件哈希值;
35)模拟eMule客户端向目的地址发送ASKSHAREDDIRS消息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310204527.1/2.html,转载请声明来源钻瓜专利网。