[发明专利]一种验证码字符识别的方法和装置在审
申请号: | 201911284188.6 | 申请日: | 2019-12-13 |
公开(公告)号: | CN111178352A | 公开(公告)日: | 2020-05-19 |
发明(设计)人: | 田浩;陈文极;林震宇;徐立宇;林晨;林智泓;陶峥;赵亮;王金哲 | 申请(专利权)人: | 中国建设银行股份有限公司;建信金融科技有限责任公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46;G06K9/62;G06N20/00 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;郭晗 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 验证 码字 识别 方法 装置 | ||
本发明公开了一种验证码字符识别的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取包含验证码的彩色第一验证码图片,根据预定义规则对所述第一验证码图片进行处理得到第二验证码图片;从所述第二验证码图片中截取相同尺寸的单个字符图片;利用机器学习算法,根据所述单个字符图片识别所述第一验证码图片中的验证码字符。该实施方式能够提高字符位置不固定,字符有一定倾斜度且背景具有干扰的验证码的精度,减少了识别此类验证码的计算成本。
技术领域
本发明涉及计算机技术领域,尤其涉及一种验证码字符识别的方法和装置。
背景技术
在企业管理中,流程自动化包括对网站的访问常常应用到企业的业务当中,有些网页的登录设置有验证码,这就对验证码自动识别的精度提出了比较高的要求;在众多种类的验证码中,一种字符位置不固定字符有一定倾斜度且背景具有干扰的验证码较为常见,目前识别此类验证码的方案中主要在除去相关的干扰后借助光学识别来识别字符,或者通过深度学习算法利用构建神经网络模型来识别字符。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:
利用光学识别程序识别验证码的方式,对于字符有一定程度的倾斜以及字符位置不定的形式,识别的精度比较低;利用深度学习的方法由于前期需要大量的样本数据以及较长时间进行模型训练,计算成本较大,计算速度较慢。
发明内容
有鉴于此,本发明实施例提供一种验证码字符识别的方法和装置,能够利用计算像素的方式识别出验证码图片中的字符,并提取出每一个字符图片,利用机器学习算法,根据单个字符图片识别验证码图片中的验证码字符,提高了识别字符位置不固定,字符有一定倾斜度且背景具有干扰的验证码的精度,减少了识别此类验证码的计算成本。
为实现上述目的,根据本发明实施例的一个方面,提供了一种验证码字符识别的方法,其特征在于,包括:获取包含验证码的彩色第一验证码图片,根据预定义规则对所述第一验证码图片进行处理得到第二验证码图片;从所述第二验证码图片中截取相同尺寸的单个字符图片;利用机器学习算法,根据所述单个字符图片识别所述第一验证码图片中的验证码字符。
可选地,所述验证码字符识别的方法,其特征在于,
所述预定义规则包括对所述第一验证码图片中的颜色进行处理得到包含两种颜色的所述第二验证码图片。
可选地,所述验证码字符识别的方法,其特征在于,
所述预定义规则还包括获取所述第一验证码图片中不同颜色对应的像素总数,根据所述像素总数确定所述第一验证码图片中验证码字符的颜色,根据所述验证码字符的颜色将所述第一验证码图片中验证码字符以外的区域处理为同种背景颜色,得到包含验证码字符颜色和背景颜色两种颜色的所述第二验证码图片。
可选地,所述验证码字符识别的方法,其特征在于,
确定用于截取所述单个字符图片的模板的尺寸,利用所述模板从所述第二验证码图片中截取相同尺寸的所述单个字符图片,所述单个字符图片中包含的字符具有倾斜度。
可选地,所述验证码字符识别的方法,其特征在于,
获取多个所述单个字符图片形成字符库,使用机器学习的分类算法对所述字符库进行训练,形成用于对所述第一验证码图片识别的分类模型,通过所述分类模型识别所述第一验证码图片的所述验证码字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司;建信金融科技有限责任公司,未经中国建设银行股份有限公司;建信金融科技有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911284188.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种业务处理时长超时预警方法和装置
- 下一篇:一种通用发票模板设置方法及系统