[发明专利]用于综合性能试验的OCR识别方法有效

专利信息
申请号: 201910501843.2 申请日: 2019-06-11
公开(公告)号: CN110287963B 公开(公告)日: 2021-11-23
发明(设计)人: 王国举;刘慧林 申请(专利权)人: 苏州玖物互通智能科技有限公司
主分类号: G06K9/34 分类号: G06K9/34;G06K9/46;G06K9/62
代理公司: 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 代理人: 苏张林
地址: 215000 江苏省苏州市工*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 用于 综合 性能 试验 ocr 识别 方法
【说明书】:

发明涉及图像识别领域,涉及一种用于综合性能试验的OCR识别方法。本发明时基于动态范围HSV、RGB六通道的颜色分割方法提取待识别文字,通过朴素贝叶斯分类器进行OCR快速训练与识别,识别特定区域环境中的屏幕上的文字,实现数字快速的分类和识别,识别准确率达到99%以上,识别速率为0.2‑0.3s/fps,其运行速度以及准确率相比传统的基于神经网络方法更快、更准确;不需要太高的硬件来支撑既可以达到较好的分类结果,极大地降低了硬件成本。

技术领域

本发明涉及图像识别领域,涉及一种用于综合性能试验的OCR识别方法。

背景技术

OCR(Optical Character Recognition,光学字符识别)是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。

目前主流的OCR都是基于卷积神经网路(CNN)的方法来实现的,如CNN+RNN+CTC、CNN+RNN基于Attention的方法等,目前主要的方法虽然准确率很高,理论上经过训练可以实现任意文字的识别。但是基于神经网络的算法都需要较高的硬件配置,需要GPU的加速,并且实时性较差。

目前开源的OCR项目有tesseract(离线)、百度OCR API(在线)等,虽然他们通用型挺好,但是特定环境(显示器上文字)中的识别率还是很低,针对性不强,而且实时性也很差,基本是在1s以上,而且网络API弱申请次数太多还存在网络不稳定等情况,对于工业上的识别要求还有一段距离。

发明内容

本发明要解决的技术问题是提供一种在识别特定区域环境中的屏幕上的文字,实现数字快速的分类和识别的用于综合性能试验的OCR识别方法。

为了解决上述技术问题,本发明解决其技术问题所采用的技术方案是:

一种用于综合性能试验的OCR识别方法,具体步骤包括:

S1、获取图像信息,通过采用RGB与HSV六通道范围提取数字区域轮廓并对带有数字的图片进行分割处理,得到待识别图片数据集;

S2、将待识别图片数据集进行预处理后得到数字样本作为训练集,将训练集输入朴素贝叶斯分类器中训练,得到每个数字训练好的训练模型;

S3、将待识别图片数据集输入搭建好的训练模型,将训练模型输出的数字与每个数字训练模型做对比,概率最大的即为识别的最终数字。

优选的,步骤S2中,对待识别图片数据集预处理具体为:对待识别图片数据集进行裁剪后统一大小与格式,然后将图片灰度处理并二值化,使得每张图片的长宽一致,且每个像素值都为0或者255。

优选的,步骤S1中,对带有数字的图片进行分割处理具体为:通过设定RGB与HSV的阈值,通过形态学方法粗提取数字区域轮廓,再筛选出具有文字区域的图片,并分割带有数字的图片,分类排序后得到待识别图片数据集。

优选的,步骤S2中,将训练集输入朴素贝叶斯分类器中训练,通过训练集数据由发生频率总结出概率,得到每个数字的计算模型:

其中Mi为数字值为i的数学模型,Ni_jk为数值为i的数字在像素坐标为j的值上像素值为k的训练图片个数,Ni总为数字值为i的总训练图片个数。

优选的,步骤S1中,对获取的图像,计算其当前帧与上一帧间的对应像素值变化,检测当前帧与上一帧间的变化区域,并对动态区域的数值进行提取。

优选的,检测当前帧与上一帧间的变化区域,对当前帧的下两帧不进行识别处理,对第三帧图片通过RGB与HSV的阈值判定,小于阈值,则该图像作为待识别图片;反之,则该图像不作为待识别图片。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州玖物互通智能科技有限公司,未经苏州玖物互通智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910501843.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top