[发明专利]网页cookie的获取方法及装置在审
| 申请号: | 201710289698.7 | 申请日: | 2017-04-27 |
| 公开(公告)号: | CN107092697A | 公开(公告)日: | 2017-08-25 |
| 发明(设计)人: | 李舜安 | 申请(专利权)人: | 努比亚技术有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 深圳市凯达知识产权事务所44256 | 代理人: | 刘大弯,沈荣彬 |
| 地址: | 518057 广东省深圳市南山区高新区北环大道9018*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 网页 cookie 获取 方法 装置 | ||
1.一种网页cookie的获取装置,其特征在于,所述获取装置包括:
获取模块,用于获取访问页面的cookie文件;
检查模块,用于检查所述获取模块获取的所述cookie文件中是否存在与待抓取页面匹配的cookie文件;
保存模块,用于当所述检查模块检查到与待抓取页面匹配的cookie文件时,则保存该匹配的cookie文件。
2.如权利要求1所述的获取装置,其特征在于,所述检查模块,具体用于:将所述获取模块获取的所述cookie文件的域名信息与所述待抓取页面的网址进行比较,判断二者是否匹配;若匹配,则确定获取的所述cookie文件中存在与所述待抓取页面匹配的cookie文件。
3.如权利要求1所述的获取装置,其特征在于,所述获取装置还包括:
判断模块,用于在所述保存模块保存该匹配的cookie文件之后,判断是否遍历完获取的所述cookie文件,若判断结果为否,则返回所述检查模块执行检查获取的所述cookie文件中是否存在与待抓取页面匹配的cookie文件的操作。
4.根据权利要求3所述的获取装置,其特征在于,所述获取装置还包括:
抓取模块,用于在所述判断模块的判断结果为是时,使用所述保存模块保存的所述cookie文件进行内容抓取。
5.根据权利要求3所述的获取装置,其特征在于,所述获取装置还包括:
请求分析模块,用于在所述判断模块的判断结果为是时,请求所述待抓取页面;以及分析所述待抓取页面的响应头,获取所述待抓取页面的cookie文件;
合并模块,用于合并获取的所述待抓取页面的cookie文件与保存的所述cookie文件;
抓取模块,用于使用合并后的所述cookie文件进行内容抓取。
6.一种网页cookie的获取方法,其特征在于,所述获取方法包括如下步骤:
获取访问页面的cookie文件;
检查获取的所述cookie文件中是否存在与待抓取页面匹配的cookie文件;
若存在,则保存该匹配的cookie文件。
7.如权利要求6所述的获取方法,其特征在于,所述检查获取的所述cookie文件中是否存在与待抓取页面匹配的cookie文件,具体包括:
将获取的所述cookie文件的域名信息与所述待抓取页面的网址进行比较,判断二者是否匹配;
若匹配,则确定获取的所述cookie文件中存在与所述待抓取页面匹配的cookie文件。
8.如权利要求6所述的获取方法,其特征在于,获取的所述cookie文件有多个,所述在保存该匹配的cookie文件之后,所述获取方法还包括:
判断是否遍历完获取的所述cookie文件;
若判断结果为否,则返回执行检查获取的所述cookie文件中是否存在与待抓取页面匹配的cookie文件的步骤。
9.如权利要求8所述的获取方法,其特征在于,若判断结果为是,则所述获取方法还包括:
使用保存的所述cookie文件进行内容抓取。
10.如权利要求8所述的获取方法,其特征在于,若判断结果为是,则所述获取方法还包括:
请求所述待抓取页面;
分析所述待抓取页面的响应头,获取所述待抓取页面的cookie文件;
合并获取的所述待抓取页面的cookie文件与保存的所述cookie文件;
使用合并后的所述cookie文件进行内容抓取。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于努比亚技术有限公司,未经努比亚技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710289698.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种主动发起会话的方法
- 下一篇:一种乘车信息处理方法以及装置





