[发明专利]一种基于窗口滑动和卷积神经网络的验证码识别方法有效

专利信息
申请号: 201711138425.9 申请日: 2017-11-16
公开(公告)号: CN107967475B 公开(公告)日: 2020-04-14
发明(设计)人: 陈开冉;缪伟宏 申请(专利权)人: 广州探迹科技有限公司
主分类号: G06K9/34 分类号: G06K9/34;G06K9/40;G06N3/04
代理公司: 广州市华学知识产权代理有限公司 44245 代理人: 刘巧霞;黄磊
地址: 510000 广东省广州市番*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 窗口 滑动 卷积 神经网络 验证 识别 方法
【说明书】:

发明针对传统的英文字母+数字+汉字验证码图片,提供一种基于窗口滑动和卷积神经网络的验证码识别方法。首先收集使用少量验证码图片,降噪后抠验证码需要识别的字符集,将每个字符集进行旋转、扭曲,增加背景噪音,然后针对这些字符集利用卷积神经网络,每个字符训练得到一个单字符分类器。最后对需要识别的验证码图片,预处理后进行连通域分割,针对每个连通域,进行窗口滑动,利用之前训练的单字符分类器进行分类,得到识别最终结果。该方法能有效解决因为验证码重叠及字符随机抖动过大难以切割的问题。而且采取少量验证码图片后抠图,自主生成相关训练集的方法,大大降低了采集和标注数据的成本。

技术领域

本发明涉及计算机视觉、图像处理研究领域,特别涉及一种基于窗口滑动和卷积神经网络的验证码识别方法。

背景技术

验证码,通常是指将一串随机产生的数字或符号,生成一幅图片,图片里加上一些干扰,例如随机画数条直线,画一些点(防止OCR),由用户肉眼识别其中的验证码信息,输入表单提交网站验证,验证成功后才能使用某项功能。一般注册用户ID的地方以及各大论坛都要输入验证码。

之所以设置验证码,主要是为了自动区分当前用户是计算机还是人,从而防止恶意破解密码、刷票、论坛灌水等,也能够有效防止某个黑客对某一个特定注册用户用特定程序暴力破解方式进行不断的登陆尝试。

虽然设置验证码可以提高系统的安全性,但是针对实际生产系统中的软件,由于需要进行自动化测试或者其他需要,如果每一次测试都人工输入验证码,将大大降低测试的效率,不能满足实际的需要。

传统的验证码自动识别方法主要包括图片降噪预处理、切割、规范化、识别四个步骤,其中难点在于难以有效切割验证码图片,进而导致后续识别失败,为此,研究一种高效准确的验证码识别方法具有重要的实用价值。

发明内容

本发明的目的在于克服现有技术的缺点与不足,提供一种基于窗口滑动和卷积神经网络的验证码识别方法,该方法能有效解决因为验证码重叠及字符随机抖动过大难以切割的问题,具有人工成本低、识别效果好、时间复杂度低的优点。

本发明的目的通过以下的技术方案实现:一种基于窗口滑动和卷积神经网络的验证码识别方法,包括步骤:

S1:收集需要破解的验证码数据样本,对每张样本图片进行二值化和预处理;

S2:从预处理后的图片中抠出字符,得到相应的字符集;针对字符集中的每个字符,进行不同参数的形状变形,以及添加不同的背景噪声,进而扩充得到该字符对应的训练数据集;

S3:将每个字符对应的训练数据集分别进行卷积神经网络训练,每个字符训练得到一个单字符分类器;

S4:对待识别的验证码图片先进行二值化和预处理,然后进行连通域分割,针对每个连通域,进行窗口滑动,利用S3训练的所有单字符分类器进行分类,取单字符分类器输出概率最大的字符作为最终识别结果。

优选的,所述步骤S1中,采用ostu二值化算法实现二值化,采用基于数学形态学腐蚀膨胀的开操作的方法对验证码图片进行降噪处理。达到去除干扰性、干扰点、去除小于一定面积的干扰区域的效果。

优选的,所述步骤S2中,扩充得到该字符对应的训练数据集,包括但不限于加噪点、线条,对字符进行平移、扩放、缩放、旋转等操作。

优选的,所述步骤S3中,进行卷积神经网络训练的步骤是:

利用每个字符对应的训练数据集,搭建基于LeNet结构的X个卷积层、Y个全连接层的深度学习神经网络模型,采用自适应估计adam算法作为优化算法,模型输出的激活函数为sigmoid,使用交叉熵cross_entropy作为代价函数,进行网络模型的训练,确保单字符分类器准确率达到预设值。

优选的,所述步骤S4中,针对预处理后的待识别的验证码图片,具体执行下述步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州探迹科技有限公司,未经广州探迹科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711138425.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top