[发明专利]基于连接体和模板的字符识别方法在审

申请号：	201810093945.0	申请日：	2018-01-31
公开（公告）号：	CN108388898A	公开（公告）日：	2018-08-10
发明（设计）人：	向保松;王井俊;唐武斌;简刚	申请（专利权）人：	宁波市科技园区明天医网科技有限公司
主分类号：	G06K9/34	分类号：	G06K9/34;G06K9/38;G06K9/62
代理公司：	杭州斯可睿专利事务所有限公司 33241	代理人：	毛翔威
地址：	315040 浙江省宁波市高新区创苑路80***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	连接体字符识别字符模板图像二值化自定义模板常规字符多个模板灰度图像模板匹配输出识别算法实现图像识别字符分割字符图像不规则加载字体合并转化
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于连接体和模板的字符识别方法，其特征在于，包括以下步骤：

a、获取字符图像：在指定区域内获取需要识别的字符图像；

b、转化灰度图像：将彩色图像转换为灰度图像；

c、图像二值化：设定阈值，将计算机内存中大于设定阈值的亮度值设置成255，小于这个值的就设置成0，从而得到只保留纯白的字符和纯黑背景的图像；

d、连接体算法实现字符分割：首先在扫描之前需准备好两个队列，一个当做暂存队列，一个当做字符队列；然后开始扫描，扫描从左上角开始，记录坐标为iCol=0，iRow=0，逐行扫描，通过for循环判断图像矩阵坐标位置byPicture[iCol][ iRow]处的字符亮度值是否等于255；

当扫描到字符存在的时候，首先将这个坐标放入暂存队列，然后通过while循环获取暂存队列的第一个坐标，存放到字符队列，同时执行上中下三行，而对于每行又执行左中右三列扫描，判断是否存在字符亮度值为255的点，如果存在则将当前坐标放入暂存队列；

如此循环就会将连着的所有位置找出来，然后把这些连接成字符的字符矩阵缓存在一个字符矩阵队列中，要求在每次扫描完都记录当前字符的右上角位置，作为下一个字符左上角开始扫描的位置，如此循环切割出所有字符矩阵；

e、字符模板加载：预先制作好一定数量的字符模板，保存在模板文件中，在第一次进行字符识别的时候就把这些字符模板加载到程序中；其中所述模板是一个字符矩阵对应一个确定的字符，并记录宽度和高度；

f、模板匹配：用切割出的字符矩阵与模板文件中的每一个字符矩阵逐一比较，看对应位置上的值是否相等，如果相等就将匹配计数+1，然后计算模板与匹配目标的匹配率，若矩阵值的匹配率达到99%就匹配成功，记录下这个匹配目标得到的字符，并将这个字符存放在识别出的队列中；

g、输出识别结果：最后按照先后顺序输出识别结果。

2.根据权利要求1所述的基于连接体和模板的字符识别方法，其特征在于：在步骤f中进行模板匹配时，若匹配率没达到要求，需要把这个未识别字符矩阵、宽度、高度保存到未识别模板文件中，然后进行模板的制备：

S1将这些未识别字符矩阵显示到未识别列表，双击列表行中的任意一行；

S2字符矩阵的形状就会显示到图像框中；

S3然后人工输入看到的字符值，点击确定；

S4上述已识别矩阵，映射到正确字符；

S5把所有未识别列表中的元素处理完，并删除夹杂的干扰元素，然后点击保存，就会自动将新识别的字符模板加入到原来的模板文件中。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于宁波市科技园区明天医网科技有限公司，未经宁波市科技园区明天医网科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810093945.0/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载