[发明专利]一种信息处理方法及系统在审

申请号：	202010697095.2	申请日：	2020-07-20
公开（公告）号：	CN111865977A	公开（公告）日：	2020-10-30
发明（设计）人：	王忠儒;余伟强;周晓雪	申请（专利权）人：	北京丁牛科技有限公司
主分类号：	H04L29/06	分类号：	H04L29/06;G06F16/951
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	林哲生
地址：	100081 北京市海淀区中关村***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种信息处理方法系统
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种信息处理方法及系统，基于针对网站的用户请求，在目标信息池中获取目标信息；根据目标信息生成与用户请求相匹配的请求信息，使得基于请求信息对网站进行信息请求，响应于对网站进行信息请求过程中获得验证码，依据所述验证码类型，输入与所述验证码类型对应的验证信息，实现通过所述网站获得与所述用户请求相匹配的信息。目标信息池包括目标浏览器的用户代理信息、目标IP代理信息、和目标cookie信息。能够通过目标信息池的目标信息对网站进行请求，由于该目标信息为网站的允许请求信息，避免网站的反爬虫系统对用户阻拦，使得用户能够快速有效获得与之权限对应的信息，提升了信息获取效率。

技术领域

本发明涉及计算机技术领域，特别是涉及一种信息处理方法及系统。

背景技术

网页爬虫不仅会盗取网站的核心内容，侵犯用户隐私和知识产权，降低被爬网站的竞争力；同时，它还会产生许多虚假用户，造成的大量IP访问网站侵占带宽资源的现象，增加网站的运营成本。为了减少网站的损失，一些网站便开始采取反爬虫技术。

但是网站采用反爬虫技术后，会使得正常用户在某一段时间内若访问较为频繁也会被认定为爬虫现象，使得该用户无法及时获得大量与其权限对应的正常信息。从而使得获取网站信息的效率较低。

发明内容

针对于上述问题，本发明提供一种信息处理方法及系统，实现了提升网站信息获取效率。

为了实现上述目的，本发明提供了如下技术方案：

一种信息处理方法，所述方法包括：

基于针对网站的用户请求，在目标信息池中获取目标信息，所述目标信息池包括目标浏览器的用户代理信息、目标IP代理信息和目标cookie信息；

根据所述目标信息生成与所述用户请求相匹配的请求信息，使得基于所述请求信息对所述网站进行信息请求；

响应于对所述网站进行信息请求过程中获得验证码，依据所述验证码类型，输入与所述验证码类型对应的验证信息，实现通过所述网站获得与所述用户请求相匹配的信息。