[发明专利]基于图像处理的钓鱼网页检测方法无效
| 申请号: | 200710130809.6 | 申请日: | 2007-08-17 |
| 公开(公告)号: | CN101145902A | 公开(公告)日: | 2008-03-19 |
| 发明(设计)人: | 曹玖新;罗军舟;毛波 | 申请(专利权)人: | 东南大学 |
| 主分类号: | H04L9/00 | 分类号: | H04L9/00;G06T7/00;G06T5/00 |
| 代理公司: | 南京经纬专利商标代理有限公司 | 代理人: | 陆志斌 |
| 地址: | 21009*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 图像 处理 钓鱼 网页 检测 方法 | ||
1.一种基于图像处理的钓鱼网页检测方法,其特征在于方法具体如下:逐一计算可疑钓鱼网页与各个受保护网页之间的相似度,将可疑网页与受保护网页之间的相似度小于预先设定的值的可疑网页判为针对该受保护网页的钓鱼网页;
上述网络钓鱼为:通过仿造网上金融或其他网络服务提供商的相关页面,诱导用户输入敏感信息,并非法取得该敏感信息的手段;
上述可疑钓鱼网页为:从可疑邮件中检测出的链接地址所指向的网页,或由用户上报的钓鱼网页;
上述受保护网页为:网络钓鱼所伪造的对象网页;
上述计算网页相似度的方法为:
步骤1,将网页转换为图像;
步骤2,对所得图像进行分割;
步骤3,提取其分割后子图像的图像特征;
步骤4,生成子图像之间的相对位置关系;
步骤5,将子图像的图像特征和子图像的相对位置关系组成该页面的特征关系集合;
步骤6,计算两个网页的特征关系集合之间的距离并以此作为这两个网页的相似度,两个网页之间的距离小于0.02的两个网页为相似网页;
其中步骤4中子图像之间的相对位置关系由一个9维向量表示,该9维向量的每个分量表示由任一子图像所确定的9个象限中的每个象限与另一子图像之间的位置关系,设用于确定9个象限的任一子图像为矩形,延长该矩形的四条边将把图像平面分为9个部分,从左上角开始顺时针编号1~8,中心编号为9,由此形成第1~9象限,该子图像与另一子图像之间相对位置关系的求取方法为:只需判断另一子图像在该子图像所分割的9个部分中的分布状况,将出现全部或部分另一子图像的象限记为1,则与该象限对应的第i维分量就为1,否则为0,根据上述方法,求出由关系矩阵表示的原网页图像所有子图像之间的相对位置关系。
2.根据权利要求1所述的基于图像处理的钓鱼网页检测方法,其特征是:图像分割方法由以下步骤组成:
步骤1,预处理:预处理是采用通用的坎尼算子边界检测方法将网页图像转换为初始二值图像;
步骤2,将预处理所得的二值图像设为初始子图像,置于待分割子图像集合中(初始该集合中只有初始子图像);
步骤3,判断待分割子图像集合是否为空,如果为空则结束,否则进入步骤4;
步骤4,从待分割子图像集合中任取某个子图像对其进行收缩处理,得到有效子图像;
步骤5,判断该有效子图像是否可分割,如果可分割,检测出该子图像中面积最大的分割带,并以此将该子图像一分为二,同时把分割后的两个子图像存入待分割子图像集合中,如果不能分割则将其存入以分割子图像集合中;
步骤6,转步骤3。
3.根据权利要求1所述的这种基于图像处理的钓鱼网页检测方法,其特征是:步骤3所述的图像特征包括彩色信息,灰度信息以及长度和宽度,彩色信息和灰度信息采用直方图统计的方法;子图像长度和宽度直接由分割结果得到,
上述彩色信息采用直方图获取方法:将原图转换到色度纯度亮度(HSV)颜色空间并将其非均匀量化为32种颜色,在此基础上提取彩色直方图,并对其进行归一化处理;灰度信息采用直方图获取方法:将原图转换为黑白图像,并对其进行拉伸,增强对比度,再将整个灰度空间量化为32个灰度,在此基础上提取灰度直方图,并对其进行归一化处理。
4.根据权利要求3所述的这种基于图像处理的钓鱼网页检测方法,其特征是:计算两个网页的特征关系集合之间相似度的方法采用嵌套运土者距离方法,该嵌套运土者距离方法为:确定步骤5所述的特征关系集合中的子图像的图像特征的相似度,所述子图像的图像特征相似度的确定方法采用综合加权距离,该综合加权距离包括归一化彩色直方图相似度、归一化灰度直方图相似度以及长宽相似度,其权值各为1/3;确定步骤5所述的特征关系集合中的子图像的相对位置关系的相似度,所述子图像的相对位置关系的相似度的确定方法采用归一化的运土者距离;最后根据子图像的图像特征相似度和子图像的相对位置关系相似度,采用嵌套运土者距离计算两个特征关系集合之间的相似度,所述嵌套运土者距离的计算方法为:首先求出所有子图像两两之间的内部距离矩阵,该内部距离矩阵的大小为M×N,其中M、N为分别为两个待检测网页中的子图像的个数,内部距离矩阵的元素由前述子图像的图像特征相似度和子图像的相对位置关系相似度给出,根据该内部距离矩阵,采用运土者距离算法求出子图像之间的外部距离,所有子图像之间的外部距离构成一个外部距离矩阵,大小为M×N,其中M、N为分别为两个待检测网页中的子图像的个数,基于该外部距离矩阵,并将两个待检测网页中所有子图像的权值设为相等,再次使用运土者距离算法求出两个待检测网页的距离,该距离即为网页的嵌套运土者距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710130809.6/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





