[发明专利]消除超文本标记语言中有害代码的方法有效

专利信息
申请号: 200610145970.6 申请日: 2006-11-28
公开(公告)号: CN101192217A 公开(公告)日: 2008-06-04
发明(设计)人: 鲍磊;陈波 申请(专利权)人: 阿里巴巴公司
主分类号: G06F17/30 分类号: G06F17/30;H04L29/06
代理公司: 北京集佳知识产权代理有限公司 代理人: 逯长明
地址: 英属开曼群岛*** 国省代码: 开曼群岛;KY
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 消除 超文本 标记 语言 有害 代码 方法
【权利要求书】:

1.一种消除超文本标记语言HTML中有害代码的方法,其特征在于,包括步骤:

遍历解析输入的HTML代码过程中:补齐不完整的HTML标签;根据预定义的规则对HTML代码进行过滤;

遍历解析经补齐和过滤的HTML代码过程中:对HTML代码根据需求按照预置的对应操作进行修正;根据预置的代码表将HTML代码中浏览器非标准代码转换为标准代码。

2.如权利要求1所述的方法,其特征在于,所述根据预定义的规则进行过滤由以下方式实现:

预定义保留规则:保留标签库中存储允许接收的HTML标签,对符合保留标签库的标签做保留处理;

预定义去除规则:去除标签库中存储不允许接收的HTML标签,对符合去除标签库的标签做去除处理;

预定义默认规则:对不在保留标签库和去除标签库中的标签仅去除其HTML标签,保留该标签下的内容;

根据预定义的保留规则、去除规则和默认规则对解析结果进行过滤。

3.如权利要求2所述的方法,其特征在于,预定义规则进一步包括:增加和/或减少和/或改变所述保留标签库和/或去除标签库中的标签。

4.如权利要求1所述的方法,其特征在于,所述修正步骤由以下方式实现:

根据检验父子关系正确性的需求,根据对应的删除操作,删除父子关系不正确的节点;和/或

根据检验超链接正确性的需求,利用正则表达式对不正确的超链接按照对应的操作进行删除,或以普通文本进行处理;和/或

根据限制输入的HTML代码内容的需求,根据预置的恶意代码库和/或根据预置的限制词汇库,利用正则表达式删除或替换该恶意代码和/或词汇。

5.如权利要求1所述的方法,其特征在于,所述转换步骤由以下方式实现:

根据预置的转换代码表,将HTML的文本中特殊代码和/或语法关键字转换为标准代码。

6.如权利要求1所述的方法,其特征在于,所述补齐和过滤步骤在两次遍历解析过程中分别完成。

7.如权利要求1所述的方法,其特征在于,所述修正和转换步骤在两次遍历解析过程中分别完成。

8.如权利要求1、6或7任一项所述的方法,其特征在于,所述遍历解析采用SAX解析或HTML DOM解析。

9.一种提交和回显包含HTML内容的方法,其特征在于,由以下步骤实现:

A.用户通过终端输入包含HTML代码的内容并提交到服务器;

B.服务器将用户提交的包含HTML代码存入数据库;

C.用户请求显示所述输入的包含HTML代码的内容;

D.数据库发送用户请求的包含HTML代码的内容到服务器;

E.服务器对收到包含HTML代码的内容进行以下处理:

遍历解析输入的HTML代码过程中:补齐不完整的HTML标签;根据预定义的规则对HTML代码进行过滤;

遍历解析经补齐和过滤的HTML代码过程中:对HTML代码根据需求按照预置的对应操作进行修正;根据预置的代码表将HTML代码中浏览器非标准代码转换为标准代码;

F.将经过处理的包含HTML代码的内容发送到客户端并显示。

10.一种提交和回显包含HTML内容的方法,其特征在于,由以下步骤实现:

A.用户通过终端输入包含HTML代码的内容,并提交到服务器;

B.服务器对收到包含HTML代码的内容进行以下处理:

遍历解析输入的HTML代码过程中:补齐不完整的HTML标签;根据预定义的规则对HTML代码进行过滤;

遍历解析经补齐和过滤的HTML代码过程中:对HTML代码根据需求按照预置的对应操作进行修正;根据预置的代码表将HTML代码中浏览器非标准代码转换为标准代码;

C.将经过处理的包含HTML代码的内容发送到数据库;

D.用户请求显示之前输入的包含HTML代码的内容;

E.数据库发送用户请求的包含HTML代码的内容经由到服务器到客户端。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴公司,未经阿里巴巴公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200610145970.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top