[发明专利]一种基于特征检测的恶意网页发现方法及系统有效
申请号: | 201810264535.8 | 申请日: | 2018-03-28 |
公开(公告)号: | CN108768921B | 公开(公告)日: | 2021-03-09 |
发明(设计)人: | 李睿;杜翠兰;李鹏霄;张鹏;陈志鹏;杨兴东 | 申请(专利权)人: | 中国科学院信息工程研究所;国家计算机网络与信息安全管理中心 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;H04L29/12 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 余功勋 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 检测 恶意 网页 发现 方法 系统 | ||
1.一种基于特征检测恶意网页发现方法,包括以下步骤:
通过读取URL文件,提取URL相关网络行为特征;其中所述提取URL相关网络行为特征包括:读取URL文件,通过Referer字段建立起每一个源IP基于时间序列的用户访问模型,记录用户访问时有所跳转的一连串URL,同时将访问过的相同URL在时间序列上串联;根据每一个源IP和目的IP对,记录其访问的URL和访问时间序列;
通过读取DNS文件,提取域名相关网络行为特征;其中所述提取域名相关网络行为特征方法为:读取DNS文件,根据源IP和域名,建立每一个用户的域名请求模型,记录其请求的所有要解析的域名和请求时间序列,同时,向权威统计网站发送HTTP请求,从返回内容中解析出域名注册时长、PR值;所述域名相关网络行为特征包括:域名请求/响应对准情况、域名记录解析类型、访问带有域名字段的URL是否有域名请求过程、访问URL时带有的域名字段和目的IP是否匹配、域名PageRank值、域名注册时长、是否固定间隔发送域名请求;
通过读取NetFlow文件,提取流量相关网络行为特征;其中所述流量相关网络行为特征包括:HTTP通信流量特征及URL统计特征;所述HTTP通信流量特征包括:并发链接同一服务器数目、并发链接同一目的端口数目、连接时长、固定起始和终止连接时间、上行流量,下行流;
针对URL相关网络行为特征,域名相关网络行为特征及流量相关网络行为特征进行规则匹配,根据匹配结果识别恶意URL。
2.如权利要求1所述的基于特征检测恶意网页发现方法,其特征在于,还包括通过实时捕获流量进行解析和/或读取网络流量Pcap包进行测试获取包含URL文件、DNS文件及NetFlow文件的网络流量数据。
3.如权利要求1所述的基于特征检测恶意网页发现方法,其特征在于,所述URL相关网络行为特征包括:URL请求相关行为特征及URL请求响应相关行为特征。
4.如权利要求1所述的基于特征检测恶意网页发现方法,其特征在于,所述规则匹配为通过正则表达式进行匹配,以发现恶意URL。
5.一种基于特征检测恶意网页发现系统,其特征在于,包括:
URL相关网络行为特征提取子模块,用以通过读取URL文件,提取URL相关网络行为特征;其中所述提取URL相关网络行为特征包括:读取URL文件,通过Referer字段建立起每一个源IP基于时间序列的用户访问模型,记录用户访问时有所跳转的一连串URL,同时将访问过的相同URL在时间序列上串联;根据每一个源IP和目的IP对,记录其访问的URL和访问时间序列;
域名相关网络行为特征提取子模块,用以通过读取DNS文件,提取域名相关网络行为特征;其中所述提取域名相关网络行为特征方法为:读取DNS文件,根据源IP和域名,建立每一个用户的域名请求模型,记录其请求的所有要解析的域名和请求时间序列,同时,向权威统计网站发送HTTP请求,从返回内容中解析出域名注册时长、PR值;所述域名相关网络行为特征包括:域名请求/响应对准情况、域名记录解析类型、访问带有域名字段的URL是否有域名请求过程、访问URL时带有的域名字段和目的IP是否匹配、域名PageRank值、域名注册时长、是否固定间隔发送域名请求;
流量相关网络行为特征提取子模块,用以通过读取NetFlow文件,提取流量相关网络行为特征;其中所述流量相关网络行为特征包括:HTTP通信流量特征及URL统计特征;所述HTTP通信流量特征包括:并发链接同一服务器数目、并发链接同一目的端口数目、连接时长、固定起始和终止连接时间、上行流量,下行流;
规则匹配子模块,用以针对URL相关网络行为特征,域名相关网络行为特征及流量相关网络行为特征进行规则匹配,根据匹配结果识别恶意URL。
6.如权利要求5所述的基于特征检测恶意网页发现系统,其特征在于,还包括一网络流量获取工具,用以通过实时捕获流量进行解析和/或读取网络流量Pcap包进行测试获取包含URL文件、DNS文件及NetFlow文件的网络流量数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所;国家计算机网络与信息安全管理中心,未经中国科学院信息工程研究所;国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810264535.8/1.html,转载请声明来源钻瓜专利网。