[发明专利]一种基于视觉高效OCR识别算法在审
申请号: | 201810402553.8 | 申请日: | 2018-04-28 |
公开(公告)号: | CN108564064A | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 欧阳德寿 | 申请(专利权)人: | 北京宙心科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46 |
代理公司: | 北京七夏专利代理事务所(普通合伙) 11632 | 代理人: | 王晓丰 |
地址: | 102400 北京市房*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 算法 模型数据 模型文件 字符识别 相似度 视觉 图像处理技术 读取 归一化处理 图像预处理 分类识别 骨架提取 可移植性 领域产品 数据使用 特征提取 第三方 识别率 保存 机器人 | ||
1.一种基于视觉高效OCR识别算法,其特征在于,包括以下两个步骤:
步骤一:字符训练;
所述字符训练包括:
(a)图像预处理;提取图像灰度图,然后计算灰度图阈值,根据阈值将灰度图进行二值化;
(b)文字定位;通过临近连通区域搜索方法定位文字区域,定位到文字位置,截取文字区域,并进行缩放;
(c)骨架提取;不同场景下,文字笔画粗细不一,将文字线条细化,提取特征统一都使用细化后的图像数据,得到预处理后的数据;
(d)特征提取;提取数据的RILBP特征,归一化处理,数据经过数据标准化处理后,各指标处于同一数量级,适合进行综合对比评价;将所有字符RILBP特征组成多个特征向量样本集,使用支持向量机SVM进行分类训练;分类训练完成后得到一个模型数据,将模型数据保存到模型文件中;
步骤二:字符识别;
所述字符识别读取所述(d)步中训练保存的模型文件,从摄像头获取图像数据;经过所述步骤一中的(a)、(b)、(c)、(d)步提取文字RILBP特征后,进行归一化处理,将归一化得RILBP数据使用SVM进行分类识别;从识别结果中选择相似度最高且达到一定相似度的结果为最终识别结果。
2.根据权利要求1所述的一种基于视觉高效OCR识别算法,其特征在于:所述步骤一中的(d)特征提取步骤采用旋转不变RILBP特征,取n*n像素的邻域,以邻域中心像素为阈值,周围相邻m个像素的灰度值与阈值进行比较。
3.根据权利要求2所述的一种基于视觉高效OCR识别算法,其特征在于:所述灰度值与阈值进行比较,当周围像素大于阈值,则该像素点的位置被标记为1,小于等于阈值则为0。
4.根据权利要求3所述的一种基于视觉高效OCR识别算法,其特征在于:所述n*n邻域内的m个像素点经过与阈值比较可得到m位二进制数,将这m位二进制数按顺时针方向依次排列形成一个二进制数值,即得中心像素的RILBP值。
5.根据权利要求4所述的一种基于视觉高效OCR识别算法,其特征在于:所述RILBP值共有2m种可能,中心像素的RILBP值反映了该像素周围区域的纹理信息,然后不断的旋转圆形邻域内的RILBP特征,得到一系列RILBP特征值,选择RILBP特征值最小的作为中心像素点的RILBP特征。
6.根据权利要求1所述的一种基于视觉高效OCR识别算法,其特征在于:所述步骤二中字符识别包括结果的容错和纠错,处理方法为首先做一个容错过滤处理,把识别出的数字号码中所有特殊字符去除,并针对不同的RILBP特征,对数字号码再进行一次容错、纠错处理,得到一个经过滤的识别结果。
7.根据权利要求6所述的一种基于视觉高效OCR识别算法,其特征在于:还包括数字号码整体识别结果校验配匹,对经过滤的识别结果,进行校验匹配,看是否完全一致,得出一个最终数字号码结果;
若不同的RILBP特征完全一致,则生成一个确定的最终识别结果;
若不一致,则根据事先的配置,确定其中一个RILBP特征优先原则,取出此RILBP特征作为最终结果,但标注为不确定结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京宙心科技有限公司,未经北京宙心科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810402553.8/1.html,转载请声明来源钻瓜专利网。