[发明专利]IP代理池的管理方法、设备和存储介质在审
申请号: | 201910856334.1 | 申请日: | 2019-09-11 |
公开(公告)号: | CN110677510A | 公开(公告)日: | 2020-01-10 |
发明(设计)人: | 王杰;童刚;叶秀清 | 申请(专利权)人: | 苏州朗动网络科技有限公司 |
主分类号: | H04L29/12 | 分类号: | H04L29/12 |
代理公司: | 32235 苏州威世朋知识产权代理事务所(普通合伙) | 代理人: | 董燕 |
地址: | 215000 江苏省苏州市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 代理IP 用途类型 应用程序 代理 站点 存储介质 访问结果 放入 访问 记录 管理 | ||
本发明揭示了一种IP代理池的管理方法、设备和存储介质,所述方法包括:获取代理IP;使用所述代理IP访问不同类型的URL站点,并根据访问结果记录所述代理IP的用途类型;根据所述代理IP的用途类型,将所述代理IP存入对应用途类型的代理池中。与现有技术相比,本发明通过将不同用途的代理IP放入不同的代理池中,从而应用程序根据站点的访问需要到对应用途的代理池中获取代理IP,提高应用程序的执行效率。
技术领域
本发明涉及计算机技术领域,尤其涉及一种IP代理池的管理方法和系统。
背景技术
对于爬虫来说,当你的访问频率达到了目标网站的预警值时,就可能触发目标网站的反爬机制。而封禁访问者IP就是很常见的一个反爬机制。当IP被封禁后,从此IP发出的请求将不能得到正确的响应。这种时候,我们就需要代理IP。
一般我们可以通过向不同的代理商获取代理IP,然后将所有代理IP放入代理池中,在使用时调用代理池中的代理IP。
但是爬虫程序在获取这种操作方式下的代理IP时,执行效率很低。
发明内容
本发明的目的在于提供一种IP代理池的管理方法、设备和存储介质。
为实现上述发明目的之一,本发明一实施方式提供一种IP代理池的管理方法,所述方法包括:
获取代理IP;
使用所述代理IP访问不同类型的URL站点,并根据访问结果记录所述代理IP的用途类型;
根据所述代理IP的用途类型,将所述代理IP存入对应用途类型的代理池中。
作为本发明一实施方式的进一步改进,所述“根据访问结果记录所述代理IP的用途类型”具体包括:
若所述代理IP能够访问http协议类型的URL站点,记录所述代理IP的用途类型包括http代理;
若所述代理IP能够访问https协议类型的URL站点,记录所述代理IP的用途类型包括https代理;
若所述代理IP能够访问sockets协议类型的URL站点,记录所述代理IP的用途类型包括sockets代理;
若所述代理IP能够访问国外的URL站点,记录所述代理IP的用途类型包括国外代理;
若所述代理IP对于http协议类型、https协议类型、sockets协议类型和国外这四种URL站点都无法访问,所述代理IP为无效的代理IP。
作为本发明一实施方式的进一步改进,所述“根据所述代理IP的用途类型,将所述代理IP存入对应用途类型的代理池中”具体包括:
若所述代理IP的用途类型包括http代理,将所述代理IP存入http代理的代理池中;
若所述代理IP的用途类型包括https代理,将所述代理IP存入https代理的代理池中;
若所述代理IP的用途类型包括sockets代理,将所述代理IP存入sockets代理的代理池中;
若所述代理IP的用途类型包括国外代理,将所述代理IP存入国外代理的代理池中。
作为本发明一实施方式的进一步改进,所述代理IP访问的URL站点为内网模拟的URL站点。
作为本发明一实施方式的进一步改进,所述“获取代理IP”具体包括:
将代理商提供的API接口写入API数据库中;
通过调用API数据库中的API接口,获取代理IP。
作为本发明一实施方式的进一步改进,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州朗动网络科技有限公司,未经苏州朗动网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910856334.1/2.html,转载请声明来源钻瓜专利网。