[发明专利]答题卡字符串识别方法、装置、终端和计算机存储介质在审
| 申请号: | 201910868938.8 | 申请日: | 2019-09-16 |
| 公开(公告)号: | CN112507758A | 公开(公告)日: | 2021-03-16 |
| 发明(设计)人: | 曾志辉;邢军华;欧阳一村;许文龙;贺涛 | 申请(专利权)人: | 深圳中兴网信科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06N3/04 |
| 代理公司: | 北京友联知识产权代理事务所(普通合伙) 11343 | 代理人: | 尚志峰 |
| 地址: | 518109 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 答题 字符串 识别 方法 装置 终端 计算机 存储 介质 | ||
1.一种答题卡字符串识别方法,其特征在于,包括:
对答题卡图像进行文本识别,获取文本内容信息以及文本位置信息;
根据所述文本内容信息以及文本位置信息定位待识别的字符串,以确定字符串所处的区域;
基于深度学习模型对所述字符串所处的区域进行识别,以获取所述字符串。
2.根据权利要求1所述的答题卡字符串识别方法,其特征在于,所述根据所述文本内容信息以及文本位置信息定位待识别的字符串,以确定字符串所处的区域,具体包括:
利用文本模版与所述文本内容信息进行匹配,根据匹配到的文本内容信息所对应的文本位置信息确定字符串所处的区域的坐标。
3.根据权利要求1所述的答题卡字符串识别方法,其特征在于,所述基于深度学习模型对所述字符串所处的区域进行识别,以获取所述字符串,具体包括:
根据所述字符串所处的区域的坐标,在已填涂的答题卡的图像中截取相应的区域图像;
对所述区域图像进行水平投影和垂直投影,根据投影结果确定所述字符串中字符的坐标;
根据所述字符的坐标,在所述区域图像中截取相应的字符图像;
根据基于深度学习的识别模型,识别所述字符图像;
合并识别结果以获取所述字符串。
4.根据权利要求3所述的答题卡字符串识别方法,其特征在于,所述对所述区域图像进行水平投影和垂直投影,根据投影结果确定所述字符串中字符的坐标,具体包括:
对所述区域图像进行二值化处理,得到二值图;
对所述二值图进行水平投影和垂直投影,生成水平投影数据和垂直投影数据;
根据水平投影数据确定限制字符填写位置的框线在水平方向上的坐标区域,根据垂直投影数据确定限制字符填写位置的框线在垂直方向上的坐标区域,所述水平方向的坐标区域对应于所述框线的上边界和下边界,所述垂直方向的坐标区域对应于所述框线的左边界和右边界;
根据所述上边界、所述下边界、所述左边界和所述右边界确定所述框线的坐标,
其中,所述水平投影用于计算所述二值图在水平方向上的像素点个数,所述垂直投影用于计算所述二值图在垂直方向上的像素点个数,所述框线的坐标即所述字符的坐标,用于表示所述字符所处的位置。
5.根据权利要求4所述的答题卡字符串识别方法,其特征在于,还包括:
根据所述框线的坐标在所述二值图中截取框线区域图像;
确定所述框线区域图像中不含有字符,则删除所述区域图像。
6.根据权利要求1至5中任一项所述的答题卡字符串识别方法,其特征在于,所述对答题卡图像进行文本识别,获取文本内容信息以及文本位置信息,具体包括:
根据光学字符识别模型识别答题卡图像,获取空白答题卡的文本内容信息以及文本位置信息。
7.根据权利要求1至5中任一项所述的答题卡字符串识别方法,其特征在于,所述字符串包括考号,所述深度学习模型包括数字识别模型。
8.一种答题卡字符串识别装置,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时能够实现如权利要求1至7中任一项所述的答题卡字符串识别方法限定的步骤。
9.一种终端,其特征在于,包括:
如权利要求8所述的答题卡字符串识别装置。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被执行时,实现如权利要求1至7中任一项所述的答题卡字符串识别方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳中兴网信科技有限公司,未经深圳中兴网信科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910868938.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种模块化实验室可移动消声设备
- 下一篇:一种泡生法蓝宝石生长热场装置





