[发明专利]一种启发式检测钓鱼网站的方法及系统在审
| 申请号: | 201510458569.7 | 申请日: | 2015-07-31 |
| 公开(公告)号: | CN105653941A | 公开(公告)日: | 2016-06-08 |
| 发明(设计)人: | 张慧云;李柏松 | 申请(专利权)人: | 哈尔滨安天科技股份有限公司 |
| 主分类号: | G06F21/55 | 分类号: | G06F21/55;G06F17/30 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 150090 黑龙江省哈尔滨*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 启发式 检测 钓鱼 网站 方法 系统 | ||
1.一种启发式检测钓鱼网站的方法,其特征在于,包括:
爬取待检测网站的首页页面源码;
提取待检测网站的所有超链接URL;
判断是否存在重复的超链接URL,若不存在,则判定为安全网站,否则提取重复率最高的超链接URL对应的所有超链接文本标签;
计算提取的超链接文本标签的内容重复率,并基于内容重复率给出可疑指数A,所述A的值与所述内容重复率成反比;
基于A的值给出待检测网站为钓鱼网站的概率。
2.如权利要求1所述的方法,其特征在于,在所述提取待检测网站的所有超链接URL之前,还包括:将所述待检测网站与白名单匹配,过滤已知安全网站。
3.如权利要求1所述的方法,其特征在于,还包括:对待检测网站的内容进行爬取,并判断是否存在敏感库中存储的敏感词汇,若不存在,则为安全网站,否则设定可疑指数B,所述B的值根据经验设定;
所述基于A的值给出待检测网站为钓鱼网站的概率,替换为:基于A与B的值综合给出待检测网站为钓鱼网站的概率。
4.如权利要求1所述的方法,其特征在于,还包括:判断待检测网站是否具备表单提交功能,若不具备,则为安全网站,否则设定可疑指数为C,所述C的值根据经验设定;
所述基于A的值给出待检测网站为钓鱼网站的概率,替换为:基于A与C的值综合给出待检测网站为钓鱼网站的概率。
5.如权利要求4所述的方法,其特征在于,还包括:判断所述表单提交过程是否为加密传输,若是,则设定可疑指数为D,否则设定可疑指数为d;
所述D和d的值根据经验进行设定,并满足D小于d;
所述基于A与C的值综合给出待检测网站为钓鱼网站的概率,替换为:基于A、C和D或者d的值综合给出待检测网站为钓鱼网站的概率。
6.一种启发式检测钓鱼网站的系统,其特征在于,包括:
源码获取模块,用于爬取待检测网站的首页页面源码;
超链接提取模块,用于提取待检测网站的所有超链接URL;
第一判定模块,用于判断是否存在重复的超链接URL,若不存在,则判定为安全网站,否则提取重复率最高的超链接URL对应的所有超链接文本标签;
计算模块,用于计算提取的超链接文本标签的内容重复率,并基于内容重复率设定可疑指数A,所述A的值与所述内容重复率成反比;
反馈模块,用于基于A的值给出待检测网站为钓鱼网站的概率。
7.如权利要求6所述的系统,其特征在于,还包括:白名单过滤模块,用于将所述待检测网站与白名单匹配,过滤已知安全网站。
8.如权利要求6所述的系统,其特征在于,还包括:敏感库匹配模块,用于对待检测网站的内容进行爬取,并判断是否存在敏感库中存储的敏感词汇,若不存在,则为安全网站,否则设定可疑指数B,所述B的值根据经验进行设定;
所述反馈模块,替换为:用于基于A与B的值综合给出待检测网站为钓鱼网站的概率。
9.如权利要求6所述的系统,其特征在于,还包括:第二判定模块,用于判断待检测网站是否具备表单提交功能,若不具备,则为安全网站,否则设定可疑指数为C,所述C的值根据经验进行设定;
所述反馈模块,替换为:用于基于A与C的值综合给出待检测网站为钓鱼网站的概率。
10.如权利要求9所述的系统,其特征在于,还包括:第三判定模块,用于判断所述表单提交过程是否为加密传输,若是,则设定可疑指数为D,否则设定可疑指数为d;
所述D和d的值根据经验进行设定,并满足D小于d;
所述反馈模块,替换为:用于基于A、C和D或者d的值综合给出待检测网站为钓鱼网站的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨安天科技股份有限公司,未经哈尔滨安天科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510458569.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能卡加密机监控装置及方法
- 下一篇:插件加载方法及装置





