[发明专利]基于动静态分离模板的客户端网页篡改检测方法有效
申请号: | 201810106150.9 | 申请日: | 2018-02-02 |
公开(公告)号: | CN108182370B | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 孟雷;袁劲松;徐钟豪 | 申请(专利权)人: | 上海斗象信息科技有限公司 |
主分类号: | G06F21/64 | 分类号: | G06F21/64;G06F16/958;G06F21/56 |
代理公司: | 上海翰信知识产权代理事务所(普通合伙) 31270 | 代理人: | 张维东 |
地址: | 201203 上海市浦东新区碧波路6*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 静态 分离 模板 客户端 网页 篡改 检测 方法 | ||
本发明提供了一种基于动静态分离模板的客户端网页篡改检测方法,首先抓取同一URL在不同时间段下的网页源码,并训练得到动静态分离模板,检测时,将模板与待测网页匹配,识别出静态篡改点和动态区域,对动态区域根据模板中的动态区域统计特征信息做篡改检测,当待测网页与模板匹配提取动态区域时,若发现模板中的动态区域起始标识节点和/或结束节点在待测网页中被篡改,需要扩展模板中的对应动态区域,并重新统计扩展后的动态区域特征信息,根据xpath将篡改数据在待测网页上展示,本发明在客户端对网页篡改检测,具有资源开销低、部署简易、不受环境条件限制、适配性强优点,支持动态网页篡改检测,并可提高网页篡改整体检测准确性。
技术领域
本发明属于网络安全技术领域,具体涉及一种基于动静态分离模板的客户端网页篡改检测方法。
背景技术
近年来,互联网行业蓬勃发展,网络已经成为人们获取信息的主要方式,随着各种新网站的出现,网络信息成指数级增长,然而伴随出现的安全问题也愈发严重。网页篡改是常见的网络安全问题。网页篡改检测即是检测网页是否被篡改,及时有效的帮助用户规避风险的一种方法。
目前,网页篡改检测的方法多数是基于服务器端部署的检测机制,此种方式资源开销大,部署复杂,受制条件多。虽然部分网页篡改检测的方法是基于客户端部署的检测机制,但均是使用特征库匹配或水印等方式做检测,无法支持内容部分可变的动态网页检测。
发明内容
本发明是为了解决上述问题而进行的,目的在于提供一种在客户端检测网页篡改,使得资源开销低、部署简易、不受环境条件限制、适配性强的基于动静态分离模板的客户端网页篡改检测方法。
本发明提供了一种基于动静态分离模板的客户端网页篡改检测方法,其特征在于,包括以下步骤:
步骤1,抓取同一URL在不同时间段的网页源码作为训练数据集;
步骤2,对所述训练数据集进行预处理:将所述训练数据集中的每份网页源码解析为Dom Tree结构,以Dom Tree的每个标签为处理单元,将处理单元格式化,并将每个DomTree中的格式化的处理单元序列化为有序列表的形式,其中,所述格式化的处理单元中至少包括textnum、tag、hash、depth、sig和动态区域统计特征信息,textnum为处理单元文本数量、tag为标签名称、hash为处理单元的哈希值、deph为处理单元所在的深度值、sig表示处理单元是否为动态区域起始标识节点;
步骤3,生成模板:提取所有预处理过的网页源码中最长公共子序列,根据所述最长公共子序列基于预定规则识别出静态区域、动态区域和动态区域起始标识节点,并统计动态区域统计特征信息,提取静态区域并根据静态区域中每个处理单元是否为动态区域起始节点对每个处理单元的sig值进行更新,根据统计出的动态区域特征信息对属于动态区域起始标识节点的处理单元的动态区域统计信息进行更新,将更新后的序列表作为模板;
步骤4,抓取待测试的与步骤1中相同的URL的网页源码;
步骤5,对步骤4中的网页源码进行预处理:预处理过程与步骤2的预处理过程相同,其中,格式化的处理单元中至少包括xpath、textnum、tag、hash、deph、sig和动态区域统计特征信息,xpath为每个处理单元的路径表达式,textnum为处理单元文本数量、tag为标签名称、hash为处理单元的哈希值、depth为处理单元所在的深度值、sig用于标识动静态区域;
步骤6,提取步骤5中预处理的网页源码和所述模板的最长公共子序列,根据最长公共子序列基于预定规则识别出该两个序列表的静态区域、动态区域和动态区域起始标识节点,并统计各动态区域特征统计信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海斗象信息科技有限公司,未经上海斗象信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810106150.9/2.html,转载请声明来源钻瓜专利网。