[发明专利]基于钓鱼网站传播的精确收集方法及系统在审
申请号: | 201210324614.6 | 申请日: | 2012-09-04 |
公开(公告)号: | CN103685158A | 公开(公告)日: | 2014-03-26 |
发明(设计)人: | 潘建波;彭仁诚 | 申请(专利权)人: | 珠海市君天电子科技有限公司;北京金山安全软件有限公司;贝壳网际(北京)安全技术有限公司;北京金山网络科技有限公司 |
主分类号: | H04L29/06 | 分类号: | H04L29/06 |
代理公司: | 广州新诺专利商标事务所有限公司 44100 | 代理人: | 张奇洲;华辉 |
地址: | 519015 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 钓鱼 网站 传播 精确 收集 方法 系统 | ||
技术领域
本发明属于计算机防御技术领域,具体涉及一种基于钓鱼网站传播的精确收集方法及系统。
背景技术
钓鱼网站是一种网络欺诈行为,指不法分子利用各种手段,仿冒真实网站的URL地址以及页面内容,或者利用真实网站服务器程序上的漏洞在站点的某些网页中插入危险的HTML代码,以此来骗取用户银行或信用卡账号、密码等私人资料或者让消费者直接以支付的方式将钱汇入骗子的银行账户中,严重地影响了在线金融服务、电子商务的发展,危害公众利益,影响公众应用互联网的信心。
为了预防钓鱼网站的危害,目前的思路有两种:
一、用一种方法或者装置来检查钓鱼网站,比如我国200910106659号专利一种钓鱼网站的检测方法及装置、我国201110172952.8号专利钓鱼网站的识别方法和装置、我国第200710072997.1号专利基于网关、网桥防范网络钓鱼网站的方法等。这些方案都企图根据钓鱼网站的特征找到一种规律,进而制定一定的检测规则去检测钓鱼网站。这些方法或者装置,初期可能具有一定的效果,但是随着钓鱼网站制作者对于检测规则的熟悉和了解,他们制作出来的新的钓鱼网站就很容易通过它们的检测,因此,此类防范方案的钓鱼网站检出率会慢慢降低,逐渐起不到防范的作用。
二、建立钓鱼网站数据库,发现一个钓鱼网站就将该钓鱼网站添加到该数据库中,通过该数据库来检查网站是不是钓鱼网站,此种方式检测率和准确率高,但该方式的一个难点是,钓鱼网站的及时收集。
目前,钓鱼网站的收集还没有一个比较好的方法,其主要方法是:用户访问一个网站—将该网站的URL在本地黑白数据库中查询是否为钓鱼网站针对本地无法识别的URL上传至服务器中进行鉴别—服务器也无法判别URL上传后台验证系统,进一步
主要是通过对海量网站的过滤收集以及举报的方式获得。由于每天都会产生大量的新网站,每个新网站都有可能是钓鱼网站,面对海量的新网站,对每一个新网站都逐一判断过滤,是不切实际的,现有的做法是随机或者根据第一点中某些规则进行判断和收集。随机的方式,没有针对性会做很多无用功;按照第一点规则判断收集,将存在同样的问题,钓鱼网站的检出率会慢慢降低。
发明内容
为了解决上述问题,本发明的目的在于提供一种基于钓鱼网站传播的精确收集方法及系统,以更加及时和准确的收集到钓鱼网站。
申请人通过仔细研究钓鱼网站的出现规律发现:为了使得钓鱼网站能够广泛传播,钓鱼网站制造者通常会将其钓鱼网站通过黑链的方式链接在一些访问量大的网站上,进而使之传播更广泛以达到广撒网的目的。
为了实现上述发明目的,基于上述研究发现,得到了以下技术方案:
一种基于钓鱼网站传播的精确收集方法,包括以下步骤:
在预设时间范围内,记录在服务器端查询过的所有网站的URL及其查询次数;
根据所述查询次数,获取排名在预设范围内的网站的URL;
检测各个URL对应的网页中是否存在黑链,若存在则获取其黑链的URL;
判断各个黑链的URL对应的网站是否为钓鱼网站;
若为钓鱼网站,则将该钓鱼网站对应的URL添加至钓鱼网站数据库中。
进一步的,所述预设的时间为24小时。
进一步的,所述预设的排名为1000名。
一种基于钓鱼网站传播的精确收集系统,包括:
查询记录模块,用于在预设时间范围内,记录在服务器端查询过的所有网站的URL及其查询次数;
排名获取模块,用于根据所述查询次数,获取排名在预设范围内的网站的URL;
黑链检测模块,用于检测各个URL对应的网页中是否存在黑链,若存在则获取其黑链的URL;
钓鱼网站判断模块,用于判断各个黑链的URL对应的网站是否为钓鱼网站,若为钓鱼网站,则启动钓鱼网站采集模块;
钓鱼网站采集模块,用于将该钓鱼网站对应的URL添加至钓鱼网站数据库中;
钓鱼网站数据库,用于存储钓鱼网站的URL数据。
进一步的,所述预设的时间为24小时。
进一步的,所述预设的排名为1000名。
本发明根据对钓鱼网站的传播特点,采用了定向收集的策略,将收集的对象集中在活跃URL(服务器端查询次数多的URL)中的黑链的URL,从而大大缩小了收集的范围。由于此范围内网站数目不是很大,完全可以做到快速而准确的鉴别该网站是否为钓鱼网站,进而将钓鱼网站添加到钓鱼网站数据库中,完成对钓鱼网站的收集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海市君天电子科技有限公司;北京金山安全软件有限公司;贝壳网际(北京)安全技术有限公司;北京金山网络科技有限公司,未经珠海市君天电子科技有限公司;北京金山安全软件有限公司;贝壳网际(北京)安全技术有限公司;北京金山网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210324614.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:网络入侵检测方法
- 下一篇:ENUM-DNS中前后台数据同步的方法及系统