[发明专利]一种信息处理方法及系统在审
| 申请号: | 202010697095.2 | 申请日: | 2020-07-20 |
| 公开(公告)号: | CN111865977A | 公开(公告)日: | 2020-10-30 |
| 发明(设计)人: | 王忠儒;余伟强;周晓雪 | 申请(专利权)人: | 北京丁牛科技有限公司 |
| 主分类号: | H04L29/06 | 分类号: | H04L29/06;G06F16/951 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 林哲生 |
| 地址: | 100081 北京市海淀区中关村*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 信息处理 方法 系统 | ||
1.一种信息处理方法,其特征在于,所述方法包括:
基于针对网站的用户请求,在目标信息池中获取目标信息,所述目标信息池包括目标浏览器的用户代理信息、目标IP代理信息和目标cookie信息;
根据所述目标信息生成与所述用户请求相匹配的请求信息,使得基于所述请求信息对所述网站进行信息请求;
响应于对所述网站进行信息请求过程中获得验证码,依据所述验证码类型,输入与所述验证码类型对应的验证信息,实现通过所述网站获得与所述用户请求相匹配的信息。
2.根据权利要求1所述的方法,其特征在于,所述基于针对网站的用户请求,在目标信息池中获取目标信息,包括:
响应于用户将用户请求发送至网站,获取所述网站针对所述用户请求的反馈信息;
若所述反馈信息满足访问失败且所述用户满足所述网站的访问权限的条件时,在目标信息池中获取与所述用户请求相匹配的目标信息。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述用户请求进行解析,获得与所述用户请求对应的目标网址;
利用所述目标信息池中的信息对所述目标网址进行信息爬取,得到初始信息;
将所述初始信息在所述用户对应的客户端进行显示,使得所述用户对所述初始信息进行选定,得到选定信息;
基于所述选定信息确定与所述选定信息对应的信息路径匹配规则;
利用所述目标信息池中的信息对所述信息路径匹配规则对应的信息进行爬取,得到目标信息。
4.根据权利要求1所述的方法,其特征在于,所述方法包括:创建目标信息池,包括:
基于获取到的浏览器的用户代理信息进行处理,得到目标浏览器的用户代理信息;
获取各个公开IP代理网站的IP代理信息,用所述IP代理信息访问目标网址进行检测,检测通过的IP代理信息确定为目标IP代理信息;
获取每个账号目标网址的用户名、密码和对应的cookie信息,并基于所述每个账号目标网址的用户名、密码和对应的cookie信息生成目标cookie信息;
将所述目标浏览器的用户代理信息、目标IP代理信息和目标cookie信息存储至目标信息池。
5.根据权利要求4所述的方法,其特征在于,所述基于获取到的浏览器的用户代理信息进行处理,得到目标浏览器的用户代理信息,包括:
对获取到的浏览器的用户代理信息进行去重处理,得到目标浏览器的用户代理信息;
所述获取各个公开IP代理网站的IP代理信息,用所述IP代理信息访问目标网址进行检测,检测通过的IP代理信息确定为目标IP代理信息,包括:
获取各个网站的IP代理信息;
将所述IP代理信息根据免费公开代理和付费代理分开处理,得到各个公开IP代理网站的IP代理信息;
对所述各个公开IP代理网站的IP代理信息访问目标网站进行检测,得到满足检测条件的目标IP代理信息;
所述获取每个账号目标网址的用户名、密码和对应的cookie信息,并基于所述每个账号目标网址的用户名、密码和对应的cookie信息生成目标cookie信息,包括:
获取每个账号目标网址的用户名、密码和对应的cookie信息,并根据所述每个账号目标网址的用户名、密码和对应的cookie信息模拟生成初始cookie信息;
对所述初始cookie信息进行检测,得到目标cookie信息。
6.根据权利要求1所述的方法,其特征在于,所述验证码类型包括图像验证码、滑动验证码、点触验证码和宫格验证码中的一种,所述依据所述验证码类型,输入与所述验证码类型对应的验证信息,包括:
依据所述验证码类型调用与所述验证码类型相匹配的调用接口;
根据所述调用接口获得待输出验证信息;
将所述待输出验证信息输入至验证信息输入框,使得所述网站获取所述待验证信息,对所述待验证信息进行验证,若验证通过允许用户对所述网站进行信息访问。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京丁牛科技有限公司,未经北京丁牛科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010697095.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:利用根系分泌物强化植物修复石油烃污染土壤的方法
- 下一篇:显示面板





