[发明专利]一种高覆盖度且准确的域名IP对应关系获取方法及装置有效
申请号: | 201710599183.7 | 申请日: | 2017-07-21 |
公开(公告)号: | CN107197058B | 公开(公告)日: | 2019-09-17 |
发明(设计)人: | 陈维;王钟;彭浩勇;贾士杨;罗干;廖艳云;易永波;林飞;毛俊;赵喜荣 | 申请(专利权)人: | 北京亚鸿世纪科技发展有限公司 |
主分类号: | H04L29/12 | 分类号: | H04L29/12 |
代理公司: | 北京辰权知识产权代理有限公司 11619 | 代理人: | 董李欣 |
地址: | 100081 北京市海淀区学*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 覆盖 准确 域名 ip 对应 关系 获取 方法 装置 | ||
本发明提供一种高覆盖度且准确的域名IP对应关系获取方法及装置,属于数据处理领域。所述方法包括:从各数据源中获取第一域名集合,通过域名系统探针设备获取第二域名集合和第一域名IP对应关系集合,通过采集设备获取第三域名集合和第二域名IP对应关系集合;融合第一域名集合、第二域名集合和第三域名集合得到域名总集,获取域名总集中各域名的IP对应关系得到第三域名IP对应关系集合;融合第一域名IP对应关系集合、第二域名IP对应关系集合和第三域名IP对应关系集合得到域名IP对应关系总集;对域名IP对应关系总集中各域名IP对应关系进行存活判断得到存活域名IP对应关系总集并保存。本发明中,获取到的域名IP对应关系准确且全面。
技术领域
本发明涉及数据处理领域,尤其涉及一种高覆盖度且准确的域名IP对应关系获取方法及装置。
背景技术
目前,通过统合多个数据源以及使用多种降噪技术,能够获得全面准确的域名和IP。在获得全面且准确的域名和IP后,研究各域名的接入IP,即域名和IP的对应关系将成为下一步的关注点。目前,获取域名和IP的对应关系的方式主要有两种,其一是使用DNS(Domain Name System,域名系统)探针获取域名和IP的对应关系,即在机房内部署DNS探针服务器,通过数据流量获取镜像数据,采集UDP(User Datagram Protocol,用户数据报协议)协议的响应包,并从数据中提取DNS六元组(CNname,源IP、目的IP、解析IP、域名,访问时间)信息,解析六元组信息获得域名IP对应关系。但是由于DNS数据量极大,导致采集的数据存在一个域名对应大量IP,一个IP对应大量域名的情况;因此该方式中,数据源的准确性得不到保障,需要经过处理才能使用。由此,DNS探针采集的域名IP对应关系存在着准确性问题。其二,使用EU (Execution Unit,执行单元)设备获取域名和IP的对应关系,即在运营商企业处部署EU采集设备,EU设备将采集通过该运营商的全部http get请求和https get请求,将请求的域名和IP的对应关系以及域名的存活状态记录;通过这部分数据可以获取域名和IP的对应关系,并对域名的存活状态进行划分;然而, EU设备采集到的数据仅为拨测过的域名和IP数据,导致其全面性得不到保障,需要其他数据源进行补充。由此,EU设备采集的域名IP对应关系存在着全面性问题。可见,现有的域名和IP对应关系的获取方式均存在弊端,不能获取到全面的、准确的域名和IP的对应关系。因此,希望有一种能够获取最准确且最全面的域名IP对应关系的方法,从而能够有效的进行行业监管。
发明内容
为克服现有技术的缺陷,本发明提供一种高效的域名IP对应关系获取方法及装置。
一方面,本发明提供一种高覆盖度且准确的域名IP对应关系获取方法,包括:
步骤S1:从各数据源中获取第一域名集合,并通过域名系统探针设备获取第二域名集合和第一域名IP对应关系集合,通过采集设备获取第三域名集合和第二域名IP对应关系集合;
步骤S2:对所述第一域名集合、所述第二域名集合和所述第三域名集合进行域名融合,得到域名总集,并获取所述域名总集中各域名的IP对应关系得到第三域名IP对应关系集合;
步骤S3:对所述第一域名IP对应关系集合、所述第二域名IP对应关系集合和所述第三域名IP对应关系集合进行域名IP对应关系融合,得到域名IP对应关系总集;
步骤S4:对所述域名IP对应关系总集中各域名IP对应关系进行存活判断得到存活域名IP对应关系总集并保存。
可选地,所述步骤S1,具体包括:
从备案数据、上报数据中获取第一域名集合;
通过域名系统探针设备获取镜像数据,在所述镜像数据中提取六元组信息,对所述六元组信息中含有的各域名进行降噪去重处理得到第二域名集合,并提取所述六元组信息中含有的各域名IP对应关系得到第一域名IP对应关系集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京亚鸿世纪科技发展有限公司,未经北京亚鸿世纪科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710599183.7/2.html,转载请声明来源钻瓜专利网。