[发明专利]消除超文本标记语言中有害代码的方法有效
| 申请号: | 200610145970.6 | 申请日: | 2006-11-28 |
| 公开(公告)号: | CN101192217A | 公开(公告)日: | 2008-06-04 |
| 发明(设计)人: | 鲍磊;陈波 | 申请(专利权)人: | 阿里巴巴公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L29/06 |
| 代理公司: | 北京集佳知识产权代理有限公司 | 代理人: | 逯长明 |
| 地址: | 英属开曼群岛*** | 国省代码: | 开曼群岛;KY |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 消除 超文本 标记 语言 有害 代码 方法 | ||
1.一种消除超文本标记语言HTML中有害代码的方法,其特征在于,包括步骤:
遍历解析输入的HTML代码过程中:补齐不完整的HTML标签;根据预定义的规则对HTML代码进行过滤;
遍历解析经补齐和过滤的HTML代码过程中:对HTML代码根据需求按照预置的对应操作进行修正;根据预置的代码表将HTML代码中浏览器非标准代码转换为标准代码。
2.如权利要求1所述的方法,其特征在于,所述根据预定义的规则进行过滤由以下方式实现:
预定义保留规则:保留标签库中存储允许接收的HTML标签,对符合保留标签库的标签做保留处理;
预定义去除规则:去除标签库中存储不允许接收的HTML标签,对符合去除标签库的标签做去除处理;
预定义默认规则:对不在保留标签库和去除标签库中的标签仅去除其HTML标签,保留该标签下的内容;
根据预定义的保留规则、去除规则和默认规则对解析结果进行过滤。
3.如权利要求2所述的方法,其特征在于,预定义规则进一步包括:增加和/或减少和/或改变所述保留标签库和/或去除标签库中的标签。
4.如权利要求1所述的方法,其特征在于,所述修正步骤由以下方式实现:
根据检验父子关系正确性的需求,根据对应的删除操作,删除父子关系不正确的节点;和/或
根据检验超链接正确性的需求,利用正则表达式对不正确的超链接按照对应的操作进行删除,或以普通文本进行处理;和/或
根据限制输入的HTML代码内容的需求,根据预置的恶意代码库和/或根据预置的限制词汇库,利用正则表达式删除或替换该恶意代码和/或词汇。
5.如权利要求1所述的方法,其特征在于,所述转换步骤由以下方式实现:
根据预置的转换代码表,将HTML的文本中特殊代码和/或语法关键字转换为标准代码。
6.如权利要求1所述的方法,其特征在于,所述补齐和过滤步骤在两次遍历解析过程中分别完成。
7.如权利要求1所述的方法,其特征在于,所述修正和转换步骤在两次遍历解析过程中分别完成。
8.如权利要求1、6或7任一项所述的方法,其特征在于,所述遍历解析采用SAX解析或HTML DOM解析。
9.一种提交和回显包含HTML内容的方法,其特征在于,由以下步骤实现:
A.用户通过终端输入包含HTML代码的内容并提交到服务器;
B.服务器将用户提交的包含HTML代码存入数据库;
C.用户请求显示所述输入的包含HTML代码的内容;
D.数据库发送用户请求的包含HTML代码的内容到服务器;
E.服务器对收到包含HTML代码的内容进行以下处理:
遍历解析输入的HTML代码过程中:补齐不完整的HTML标签;根据预定义的规则对HTML代码进行过滤;
遍历解析经补齐和过滤的HTML代码过程中:对HTML代码根据需求按照预置的对应操作进行修正;根据预置的代码表将HTML代码中浏览器非标准代码转换为标准代码;
F.将经过处理的包含HTML代码的内容发送到客户端并显示。
10.一种提交和回显包含HTML内容的方法,其特征在于,由以下步骤实现:
A.用户通过终端输入包含HTML代码的内容,并提交到服务器;
B.服务器对收到包含HTML代码的内容进行以下处理:
遍历解析输入的HTML代码过程中:补齐不完整的HTML标签;根据预定义的规则对HTML代码进行过滤;
遍历解析经补齐和过滤的HTML代码过程中:对HTML代码根据需求按照预置的对应操作进行修正;根据预置的代码表将HTML代码中浏览器非标准代码转换为标准代码;
C.将经过处理的包含HTML代码的内容发送到数据库;
D.用户请求显示之前输入的包含HTML代码的内容;
E.数据库发送用户请求的包含HTML代码的内容经由到服务器到客户端。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴公司,未经阿里巴巴公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200610145970.6/1.html,转载请声明来源钻瓜专利网。





