[发明专利]基于图像处理的钓鱼网页检测方法无效
| 申请号: | 200710130809.6 | 申请日: | 2007-08-17 |
| 公开(公告)号: | CN101145902A | 公开(公告)日: | 2008-03-19 |
| 发明(设计)人: | 曹玖新;罗军舟;毛波 | 申请(专利权)人: | 东南大学 |
| 主分类号: | H04L9/00 | 分类号: | H04L9/00;G06T7/00;G06T5/00 |
| 代理公司: | 南京经纬专利商标代理有限公司 | 代理人: | 陆志斌 |
| 地址: | 21009*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 图像 处理 钓鱼 网页 检测 方法 | ||
技术领域
本发明涉及图像信息处理以及网络安全领域,涉及一种反网络钓鱼的方法,尤其涉及一种基于图像处理的钓鱼网页检测方法。
背景技术
网络钓鱼(Web Phishing)是一种在线身份冒充,它综合使用社会工程学(即骗术)和技术手段(包括恶意代码、钓鱼邮件、监听软件等),以窃取网络用户的个人身份信息或帐号、密码、信用卡号等。网络钓鱼目前已经成为用户信息安全的极大威胁,并给用户造成了巨大的经济损失(据权威机构预测美国2007年因网络钓鱼引起的损失达到28亿美元);同时由于网络钓鱼的肆虐,恶化了网络生态环境,严重阻碍了我国网上银行、在线支付等电子金融的发展。
目前常用对网络钓鱼的防范主要包括以下三种措施。
一、电子邮件检测。该方法通过在邮件服务器上设置邮件过滤策略,通过检测邮件中的超链接,内嵌脚本中域名的有效性和一致性来发现钓鱼网页。
二、个人信息保护。该方法通过检测用户发出的所有信息的目的地址,以及所发信息的机密程度来判断此次发送的安全性,如果发现不安全的发送便会阻断该发送或向用户询问是否在有威胁的情况下继续发送。
三、网络行为检测。该方法通过模拟用户的提交行为,向网页发送预先构造的用户名和密码,如果服务器回应提交成功,则证明该网页为钓鱼网页。
但以上三种方法都存在很大的不足,方法一无法检测包含图像的邮件,包括使用图片和映射的方法提供的链接或以图片显示的地址等;方法二则会大幅降低网络速度,同时规则的维护也极为复杂,而且涉及用户的隐私,因此很难部署;方法三无法应对桥接攻击,同时简单的自动提交防范机制(验证码)就能使该方失效。
发明内容
本发明针对现有技术的不足和缺陷,提供一种准确性高、可靠性强且能够减小被欺骗可能性的基于图像处理的钓鱼网页检测方法。
本发明采用如下技术方案:
逐一计算可疑钓鱼网页与各个受保护网页之间的相似度,将可疑网页与受保护网页之间的相似度小于预先设定的值的可疑网页判为针对该受保护网页的钓鱼网页;
上述网络钓鱼为:通过仿造网上金融或其他网络服务提供商的相关页面,诱导用户输入敏感信息,并非法取得该敏感信息的手段;
上述可疑钓鱼网页为:从可疑邮件中检测出的链接地址所指向的网页,或由用户上报的钓鱼网页;
上述受保护网页为:网络钓鱼所伪造的对象网页;
上述计算网页相似度的方法为:
步骤1,将网页转换为图像;
步骤2,对所得图像进行分割;
步骤3,提取其分割后子图像的图像特征;
步骤4,生成子图像之间的相对位置关系;
步骤5,将子图像的图像特征和子图像的相对位置关系组成该页面的特征关系集合;
步骤6,计算两个网页的特征关系集合之间的距离并以此作为这两个网页的相似度,两个网页之间的距离小于0.02的两个网页为相似网页;
其中步骤4中子图像之间的相对位置关系由一个9维向量表示,该9维向量的每个分量表示由任一子图像所确定的9个象限中的每个象限与另一子图像之间的位置关系,设用于确定9个象限的任一子图像为矩形,延长该矩形的四条边将把图像平面分为9个部分,从左上角开始顺时针编号1~8,中心编号为9,由此形成第1~9象限,该子图像与另一子图像之间相对位置关系的求取方法为:只需判断另一子图像在该子图像所分割的9个部分中的分布状况,将出现全部或部分另一子图像的象限记为1,则与该象限对应的第i维分量就为1,否则为0,根据上述方法,求出由关系矩阵表示的原网页图像所有子图像之间的相对位置关系。本发明通过将网页转化为图像,并对所的图像进行分割、特征提取、子图像关系检测得到特征关系集合,再求出可疑网页与受保护网页之间特征关系集合的NEMD距离,从而发现可疑网页与受保护网页之间的相似度,并根据该相似度判断可疑网页是否是钓鱼网页。如果可疑网页与受保护网页及其相似,则该可疑网页已经侵犯了受保护网页的“肖像权”,即使该可疑网页并非钓鱼网页也会误导用户并引发不必要的威害。
本发明的特点是直接分析用户所访问的网页图像,可靠性高,不易被网页设计技巧所欺骗;通过对网页图片进行分割可以进行部分匹配,防止由于部分相似而引起的网络钓鱼;使用子图像特征和关系并重的匹配方法,更加符合视觉心理学,使匹配结果更加准确。根据试验测得的数据显示,本发明具有网页图像检测准确性高的优点。
附图说明
图1钓鱼网页检测流程图。
图2为本发明所述分割方法的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710130809.6/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





