[发明专利]一种基于对抗学习的图像对抗验证码生成方法和系统有效
申请号: | 201810407183.7 | 申请日: | 2018-04-28 |
公开(公告)号: | CN108717550B | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 纪守领;施程辉;徐晓刚;陈建海 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/34;G06K9/36 |
代理公司: | 杭州天勤知识产权代理有限公司 33224 | 代理人: | 高燕 |
地址: | 310013 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 对抗 学习 图像 验证 生成 方法 系统 | ||
本发明公开了一种基于对抗学习的图像对抗验证码生成方法,包括以下步骤:(1)选择一个图像识别神经网络A和攻击算法a;(2)根据训练的图像识别模型A和攻击算法a,基于对抗学习方法生成图像对抗验证码;(3)选择一个或多个图像识别模型B,选择一个或多个攻击算法b,根据图像识别模型B和攻击算法b,对步骤(2)中生成的图像对抗验证码进行破解;根据破解结果,调整图像对抗验证码的生成策略;(4)根据调整好的图像对抗验证码生成策略生成图像对抗验证码。本发明图像对抗验证码生成系统。本发明通过对抗学习在图像验证码中添加少量特殊噪音来攻击深度图像识别模型,以削弱验证码破解者攻击能力的方式来保护图像验证码的安全性。
技术领域
本发明涉及机器学习模型安全和图像验证码安全领域,尤其涉及一种基于对抗学习的图像对抗验证码生成方法和系统。
背景技术
验证码是一种人类很容易解决但当前程序很难解决的图灵测试。它被广泛部署在Web网页上,可以有效地阻止一些恶意行为,如批量注册僵尸帐号、黑产撞库等。
验证码有很多种类型,其中一种常用的验证码是基于图像识别的验证码,简称图像验证码。图像验证码要求用户在一组图像中正确地选择所有符合特定语义的图像。相较于其他类型的验证码,图像验证码在安全性和可用性两方面有着更好的平衡:图像拥有非常丰富的信息,同一张图像在不同背景下可以有不同的含义,计算机很难自动破解,所以图像验证码的安全性很高;同时人类天生对图像信息敏感,可以很容易识别图像中的语义,因此图像验证码的可用性也很高。在实际中,很多网站已经部署了图像验证码,如12306火车购票网站就是采用图像验证码来阻止黄牛刷票。
然而,近些年来随着机器学习算法尤其是深度学习算法的进步,计算机的图像识别能力突飞猛进,单纯的图像识别对机器而言已经不是难题。在这种情况下,图像验证码的安全性受到了很大的挑战。攻击者可以事先爬取验证码中的图像,然后人工标注这些图像,最后利用这些标注好的图像,通过深度学习算法训练出一个深度图像识别模型来破解图像验证码。同时由于现在无法通过程序自动产生特定语义的图片,图像验证码中使用的图像素材是通过人工在互联网上抓取图片。事实上,由于经济性的考量,图像验证码中使用的图片素材会在一段时间内重复使用,周期性替换。这个事实使得图像验证码更容易被基于深度学习的方法破解。虽然现在也有一些增强手段:如减小图像的分辨率、增加候选图像的数量、频繁更换图像素材等。但这些手段不仅只能略微提升图像验证码的安全性,反而会大幅破坏验证码的可用性或增大经济成本。因此现在迫切需要一种能够兼顾安全性、可用性和经济性的新型图像验证码策略。
事实上,最近的研究发现,深度学习算法本身有致命的缺点。只需要在图像中添加少量特殊的噪音(甚至这些噪音人眼都无法察觉),深度图像识别模型都会将这张修改后的图片的分类错误。而这些特殊的噪音可以通过多种基于对抗学习的方法来产生。不仅如此,大量的研究显示,这一漏洞是深度学习算法的底层缺陷,虽然已经提出了很多的防御方法,但这些方法都只能缓解缺陷。
现有的对抗学习方法是为了探索深度学习算法的漏洞,在产生对抗噪音时,假定的情况是攻击者最优,即攻击者知道目标模型的所有参数且被攻击者不会采用任何防御手段。在这种攻击者最优的设定下,目前基于对抗学习的噪音生成算法期望添加尽可能少的噪音来达到欺骗深度图像识别模型的效果。然而在验证码攻防的环境下,我们作为防御方,却无法提前了解验证码破解者使用的模型参数;甚至破解者在识别图像前会使用图像预处理手段对图像进行处理,去除噪音。这样在图像中添加噪音便不能达到欺骗破解者分类器的效果,现有基于对抗学习的噪音生成方法不能满足对抗验证码防御的需要。
发明内容
本发明提供一种基于对抗学习的图像对抗验证码生成方法,通过对抗学习在图像验证码中添加少量特殊噪音来攻击深度图像识别模型,以削弱验证码破解者攻击能力的方式来保护图像验证码的安全性,和以往被动防御的方法不同,本发明提供了一种主动防御的策略。
本发明提供了如下技术方案:
一种基于对抗学习的图像对抗验证码生成方法,包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810407183.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序