[发明专利]一种反爬虫方法、服务器和客户端有效

申请号：	201810118999.8	申请日：	2018-02-06
公开（公告）号：	CN108449316B	公开（公告）日：	2020-07-03
发明（设计）人：	苏思洋;李涛	申请（专利权）人：	麒麟合盛网络技术股份有限公司
主分类号：	H04L29/06	分类号：	H04L29/06;H04L29/08
代理公司：	北京国昊天诚知识产权代理有限公司 11315	代理人：	许志勇
地址：	100085 北京市海淀区信息路2号（北京***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种爬虫方法服务器客户端
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种反爬虫方法、服务器和客户端，所述方法包括：在服务器中，根据预设乱序规则，对原始数据进行乱序处理，得到与原始数据对应的乱序数据，以及确定与预设乱序规则对应的乱序标识，其中，乱序标识用于在客户端进行网页展示时将乱序数据转换为原始数据；根据乱序数据和乱序标识，生成与乱序数据对应的网页源码；在接收到客户端发送的网页访问请求后，向客户端返回网页源码，以供客户端展示原始数据，使得在客户端被爬虫爬取时，爬虫获取到的网页源码中为乱序数据，而客户端展示给用户的为乱序数据所对应的原始数据，从而既能够避免原始数据的泄漏，又不影响用户的正常浏览，有效提高了网站安全性能。

技术领域

本申请涉及信息安全技术领域，尤其涉及一种反爬虫方法、服务器和客户端。

背景技术

网络爬虫(简称爬虫)，是一种通过网页的链接地址寻找网页，并按照一定的规则，自动获取网页内容的程序。

目前的爬虫技术已经很普遍，通过设定的规则，爬虫可以轻易地抓取网页源码中一些重要信息，例如，商品价格、商家电话号码、商品评分或商品关键参数等，造成网站信息泄漏，降低网站安全性能。

发明内容

本申请实施例提供一种反爬虫方法、服务器和客户端，用以解决现有的爬虫爬取造成的网站信息泄漏问题。

本申请实施例提供了一种反爬虫方法，所述方法应用于服务器，所述方法包括：

根据预设乱序规则，对原始数据进行乱序处理，得到与所述原始数据对应的乱序数据；

确定与所述预设乱序规则对应的乱序标识，其中，所述乱序标识用于在客户端进行网页展示时将所述乱序数据转换为所述原始数据；

根据所述乱序数据和所述乱序标识，生成与所述乱序数据对应的网页源码；

在接收到所述客户端发送的网页访问请求后，向所述客户端返回所述网页源码，以供所述客户端展示所述原始数据。