[发明专利]恶意网址的检测方法及装置有效
申请号: | 201210453701.1 | 申请日: | 2012-11-13 |
公开(公告)号: | CN103810425A | 公开(公告)日: | 2014-05-21 |
发明(设计)人: | 陶思南 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F21/56 | 分类号: | G06F21/56;G06F17/30 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 恶意 网址 检测 方法 装置 | ||
技术领域
本发明涉及URL检测领域,尤其涉及一种恶意网址的检测方法及装置。
背景技术
网络丰富了人们的生活,但是越来越多的色情、欺诈钓鱼网站也层出不穷,严重威胁了广大网民在网上获取信息的安全,由此就需要识别恶意网址的检测引擎。
现有的URL云检测引擎可以有效识别和提示用户访问的URL(Uniform / Universal Resource Locator,统一资源定位符)是否具有恶意特性。在用户输入要访问的URL之后、浏览器显示出页面内容之前,URL云检测引擎需要到云检测中心获取用户访问的URL的恶意属性,并对其进行识别后,进行相关的提示。由于恶意站点的变幻多端,因此URL云检测引擎必须具备快速、高效、准确的特性,从而确保恶意网站能够及时、准确地被发现。
现有的URL云检测引擎对恶意属性的识别主要通过页面DOM与BOM对象中的文字信息,利用贝叶斯分类器/关键词过滤、相似度匹配等机器学习的方式进行。虽然上述技术可以有效地识别以文字内容为主的恶意欺诈网址,但是对于非文字性的网页内容却显得无能为力。
而且,现有技术中恶意页面可以通过以下方式逃避检测引擎的查杀:
(1)文字内容的图片化:把整个页面内容做到一张图片里,通过整个页面就是一张图片的方式来对抗查杀;
(2)对明文文字进行加密隐藏:由于当前技术主要依赖页面的文字信息,因此,恶意网页的编写者们采用加密的技术对明文的文字信息进行因此,当判别模块遇到了一串没有任何语义的加密串时,就不能有效地识别该恶意网页;
(3)利用流媒体进行对抗:为了防止被当前检测技术识别,现在的恶意网页开始利用flash等流媒体将文字信息隐藏其中进行显示,有效地逃离了现有检测技术的查杀;
(4)利用正常的文字信息进行干扰:为了逃脱现有技术的查杀,通过在当前页面内容中加入大量的不予显示的正常文本对识别程序进行干扰。
由上可知,如何高效准确地检测出当前的恶意网址,已经成为了现在检测技术面临的难题与挑战。
发明内容
本发明的主要目的是提供一种恶意网址的检测方法,旨在高效准确地检测出恶意网址,保障用户获取网上信息的安全。
本发明提供了一种恶意网址的检测方法,包括以下步骤:
接收URL检测请求,对该URL检测请求中URL所指向的页面内容进行分析,判断其该页面是否为非文字性页面;
若是,则获取该URL检测请求中URL在浏览器显示的页面图片;
对该生成的页面图片进行图片检测,获得该URL检测请求中URL的页面属性;
根据该URL检测请求中URL的页面属性,确定该URL是否为恶意网址。
本发明还提供了一种恶意网址的检测装置,包括:
页面解析模块,用于接收URL检测请求,对该URL检测请求中URL所指向的页面内容进行分析,判断其该页面是否为非文字性页面;
页面属性识别模块,用于在判断URL所指向的页面为非文字性页面时,获取该URL检测请求中URL在浏览器显示的页面图片;对该生成的页面图片进行图片检测,获得该URL检测请求中URL的页面属性;根据该URL检测请求中URL的页面属性,确定该URL是否为恶意网址。
本发明通过对URL检测请求中URL所指向的页面内容进行分析,当判断该页面为非文字性页面时,则对该URL在后台浏览器显示的页面进行网页截取,并对截取的网页图片进行检测,以获得该URL检测请求中URL的页面属性;当判断页面为文字性页面时,则对页面文字进行检测,以该URL检测请求中URL的页面属性;最后再根据URL检测请求中URL的页面属性,确定该URL是否为恶意网址。因此,本发明恶意网址的检测方法不但可以有效识别整页网页图片类型的恶意网址,还可以有效识别通过各种加密手段及恶意干扰等方式逃避检测的恶意网址,进一步保障了用户获取网上信息的安全。
附图说明
图1是本发明恶意网址的检测方法一实施例的结构示意图;
图2是本发明恶意网址的检测方法中,对URL检测请求中URL所指向的页面进行解析的流程示意图;
图3是本发明恶意网址的检测方法中,对URL检测请求中URL所指向的非文字性页面的处理的流程示意图;
图4是本发明恶意网址的检测装置一实施例的结构示意图;
图5是本发明恶意网址的检测装置中页面解析模块的结构示意图;
图6是本发明恶意网址的检测装置中页面属性识别模块的结构示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210453701.1/2.html,转载请声明来源钻瓜专利网。