[发明专利]验证码识别方法、装置、终端及存储介质有效
| 申请号: | 201910158617.9 | 申请日: | 2019-03-04 |
| 公开(公告)号: | CN109919160B | 公开(公告)日: | 2021-03-23 |
| 发明(设计)人: | 王卡风;须成忠;曹廷荣 | 申请(专利权)人: | 深圳先进技术研究院 |
| 主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/00 |
| 代理公司: | 深圳市科进知识产权代理事务所(普通合伙) 44316 | 代理人: | 吴乃壮 |
| 地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 验证 识别 方法 装置 终端 存储 介质 | ||
本发明公开了一种验证码识别方法、装置、终端及存储介质。该方法包括:获取验证码图像,并对验证码图像进行预处理;根据预设切割范围对验证码图像进行切割,得到多个待识别字符图像;通过预设识别模型对多个待识别字符图像进行识别;计算每个待识别字符图像的识别准确率;当识别准确率未超过预设阈值时,调整预设切割范围并重新切割,再根据切割结果训练预设识别模型,直至识别准确率超过预设阈值。本发明在验证码识别过程中,将难以识别的验证码重新切割并对预设识别模型进行训练,从而使得预设识别模型的识别能力更强,提升预设识别模型的识别准确率。
技术领域
本发明涉及互联网安全技术领域,尤其涉及一种验证码识别方法、装置、终端及存储介质。
背景技术
在人机智能交互中,尤其是让机器模拟人的行为,来智能识别验证码是一项重要的技术。验证码有多种类型,基于图像的验证码是最为广泛使用的技术之一。那么让机器自动识别图像验证码就是完成机器模拟人的一项基础技术之一,基于图像的验证码识别一般要对字符进行切割,然后使用机器学习或者深度学习的方法对字符进行分类。字符切割的准确程度直接影响到最终预测结果的好坏。在实际中验证码都是随机生成的,不同的生成算法得到的验证码有不同的切割方法。
现阶验证码种类繁多,对于数字、字符和汉字类型验证码识别的方法主要步骤如下:首先,通过二值化、空间滤波器、变换等图像处理技术去除验证码中的干扰信息。其次,使用投影、类聚或目标检测等方法确定字符在图像中的位置并进行切割。再次,提取出字符的特征值利用机器学习中的SVM或卷积神经网络等算法进行分类。最后,根据分类的结果得到最终验证码的值。但是,现有的验证码识别方法都没有很好的解决黏贴字符分割的问题,导致验证码的识别准确率不高。
发明内容
本发明提供了一种验证码识别方法、装置、终端及存储介质,以解决现有验证码识别过程中黏贴字符不能很好的分割,导致验证码识别准确率不高的问题。
为了解决上述问题,本发明提供了一种验证码识别方法,其包括:
获取验证码图像,并对验证码图像进行预处理;
根据预设切割范围对验证码图像进行切割,得到多个待识别字符图像;
通过预设识别模型对多个待识别字符图像进行识别;
计算每个待识别字符图像的识别准确率;
当识别准确率未超过预设阈值时,调整预设切割范围并重新切割,再根据切割结果训练预设识别模型,直至识别准确率超过预设阈值。
作为本发明的进一步改进,对验证码图像进行预处理的步骤包括:
将验证码图像进行灰度化操作;
对灰度化的验证码图像进行二值化处理,再通过空间滤波器确认干扰区域和/或干扰线条,并删除干扰区域和/或干扰线条。
作为本发明的进一步改进,计算每个待识别字符图像的识别准确率的步骤,包括:
统计每个待识别字符图像的识别正确次数和识别错误次数;
计算每个待识别字符图像的识别准确率,识别准确率=识别正确次数/(识别正确次数+识别错误次数)。
作为本发明的进一步改进,调整预设切割范围并重新切割,再根据切割结果训练预设识别模型,直至识别准确率超过预设阈值的步骤,包括:
调整预设切割范围;
利用U-Net网络根据调整后的预设切割范围对验证码图像进行切割,得到待训练字符图像;
通过预设识别模型对待训练字符图像进行识别,并根据识别结果计算待训练字符图像的识别准确率;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910158617.9/2.html,转载请声明来源钻瓜专利网。





