[发明专利]一种页面处理方法和装置有效
| 申请号: | 201210134966.5 | 申请日: | 2012-05-02 |
| 公开(公告)号: | CN103383687B | 公开(公告)日: | 2017-03-01 |
| 发明(设计)人: | 陈波 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京润泽恒知识产权代理有限公司11319 | 代理人: | 苏培华 |
| 地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 页面 处理 方法 装置 | ||
1.一种页面处理方法,其特征在于,包括:
解析页面请求中的参数信息,所述参数信息包括目标域名和标示所述页面请求属于第一模块的第一标识;所述页面请求由第一模块的用户端发起,所述页面请求对应的页面内容由对应的第三模块提供;
对于包括第一标识的请求,根据该请求中的目标域名将其转发至相应的第三模块,并从所述第三模块获取响应的页面内容;
加载配置模块的配置文件中对应所述第一标识的配置信息,并根据所述配置信息对所述页面内容进行处理;
返回所述处理后的页面内容。
2.根据权利要求1所述的方法,其特征在于,通过如下步骤加载配置模块的配置文件中对应所述第一标识的配置信息,并根据所述配置信息对所述页面内容进行处理:
步骤A1,加载配置模块的配置文件中对应所述第一标识的配置信息;
步骤A2,从所述页面内容中查找与所述配置信息中各结点信息对应的结点信息;
步骤A3,根据配置信息中对各结点信息的描述对所述页面内容中的结点信息进行修改。
3.根据权利要求2所述的方法,其特征在于,通过如下步骤从所述页面内容中查找与所述配置信息中各结点信息对应的结点信息:
根据配置信息中待修改结点的标签名和属性信息对应的字符串,通过将所述字符串与页面内容对应的字符串进行匹配,查找页面内容中所述结点信息;
或,根据配置信息中待修改结点信息的标签名和属性信息,通过遍历所述页面内容的DOM树,查找页面内容中所述结点信息。
4.根据权利要求1所述的方法,其特征在于:
所述各步骤在代理模块中执行。
5.根据权利要求4所述的方法,其特征在于,对所述页面内容进行处理还包括:
步骤A4,将页面内容中的原目标链接地址替换为代理地址。
6.根据权利要求1所述的方法,其特征在于,通过以下步骤解析页面请求参数信息:
步骤B1,解析请求URL,获取请求中的域名;
步骤B2,验证域名是否合法;如果不合法,转入步骤B3,如果合法,转入B4;
步骤B3,拒绝本次访问请求;
步骤B4,提取请求中用户端参数信息。
7.根据权利要求6所述的方法,其特征在于:
所述的用户端参数信息包括第一标识,用户端的IP,和用户端的类型。
8.根据权利要求6或7所述的方法,其特征在于,还包括:
URL处理步骤,减少URL的链接长度,并将URL中包含的统计参数添加到返回页面内容的各URL中。
9.根据权利要求5或6所述的方法,其特征在于,所述对于包括第一标识的请求,根据该请求中的目标域名将其转发至相应的第三模块,并从所述第三模块获取响应的页面内容的步骤包括:
步骤D1,根据请求中请求方的身份信建立一个模拟HTTP请求;
步骤D2,执行所述模拟HTTP请求,获取响应的页面内容。
10.根据权利要求1或9所述的方法,其特征在于,执行所述模拟HTTP请求,获取响应的页面内容时:
当HTTP响应代码为正常,则直接获取响应的页面内容并缓存;
当HTTP响应代码为所述页面请求需要重新定位,则让第一服务器重新访问代理地址。
11.一种页面处理装置,其特征在于,包括:
请求受理模块,用于解析页面请求中的参数信息,所述参数信息包括目标域名和标示所述页面请求属于第一模块的第一标识;所述页面请求由第一模块的用户端发起,所述页面请求对应的页面内容由对应的第三模块提供;
请求转发模块,用于对于包括第一标识的请求,根据该请求中的目标域名将其转发至相应的第三模块,并从所述第三模块获取响应的页面内容;
内容处理模块,用于加载配置模块的配置文件中对应所述第一标识的配置信息,并根据所述配置信息对所述页面内容进行处理;
页面返回模块,用于返回所述处理后的页面内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210134966.5/1.html,转载请声明来源钻瓜专利网。





