[发明专利]一种利用图像识别实现证照电子化的应用模型在审

申请号：	201710099520.6	申请日：	2017-02-23
公开（公告）号：	CN106886776A	公开（公告）日：	2017-06-23
发明（设计）人：	宁方刚;王冠军;陈兆亮	申请（专利权）人：	山东浪潮云服务信息科技有限公司
主分类号：	G06K9/34	分类号：	G06K9/34;G06K9/40;G06K9/46;G06T11/60
代理公司：	济南信达专利事务所有限公司37100	代理人：	姜明
地址：	250100 山东省济南市高***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种利用图像识别实现证照电子应用模型
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种利用图像识别实现证照电子化的应用模型，其特征在于，

基于图像分析和OCR识别技术，通过对图像二值化处理和特征区域识别后，利用OCR识别技术对图像上的文字进行解析和规范化处理；

对证照图像特征进行分析处理；

读取中文文字库，识别证照图像中的文字，处理特殊字符，规范为key-value格式。

2.根据权利要求1所述的应用模型，其特征在于，

主要包括三个步骤，图像预处理、文字提取、信息映射三个步骤，

1）利用OpenCV对图像预处理去除噪声，提取出文字区域，提高识别效率；

2）借助Tesseract-OCR进行文字识别，并对识别结果作规范化处理；

3）读取证照模板的配置信息，与识别结果匹配，实现将证照图像信息映射到证照的电子模型中，并将证照的电子化结果进行存储。

3.根据权利要求2所述的应用模型，其特征在于，

图像预处理阶段是基于开源项目OpenCV实现的，首先，对用户上传的证照图像进行灰度化处理，选择[0,255]中适当的阈值作图像二值化处理；针对图像边缘的干扰，利用MSER算法进行连通区域特征检测，找出图像的稳定区域；最后，进行图像小区域筛选和链接，生成待识别的图像。

4.根据权利要求3所述的应用模型，其特征在于，

在文字提取阶段，将预处理过的图像送入开源的文字识别软件，Tesseract-OCR；Tesseract-OCR对图像进行布局分析，区分出图像的表格、图片、文本信息，之后利用字符间的间隔进行切分，依据中文字库等信息对文字进行解析，得出识别文本，从而生成初步的识别结果；系统在获取到初步的识别结果后，去除结果中的空格等特殊字符，对识别结果进行规范化，令识别结果按key-value的形式组织，返回处理后的识别结果。

5.根据权利要求4所述的应用模型，其特征在于，

信息映射阶段，获取证照模板的配置信息，确定证照上具有的信息以及这些信息在纸质版上的标识，利用信息标识与文字识别结果进行匹配，从而将识别到的文字映射到证照的模型中；匹配结束后，在软件界面中向用户展示生成的电子证照信息，由用户在必要时对电子证照进行人工校正。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于山东浪潮云服务信息科技有限公司，未经山东浪潮云服务信息科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710099520.6/1.html，转载请声明来源钻瓜专利网。

上一篇：一种车标识别方法、及启动方法
下一篇：一种荧光显微图像二值化的自适应阈值方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种利用图像识别实现证照电子化的应用模型在审

专利文献下载