[发明专利]一种利用图像识别实现证照电子化的应用模型在审
申请号: | 201710099520.6 | 申请日: | 2017-02-23 |
公开(公告)号: | CN106886776A | 公开(公告)日: | 2017-06-23 |
发明(设计)人: | 宁方刚;王冠军;陈兆亮 | 申请(专利权)人: | 山东浪潮云服务信息科技有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/40;G06K9/46;G06T11/60 |
代理公司: | 济南信达专利事务所有限公司37100 | 代理人: | 姜明 |
地址: | 250100 山东省济南市高*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 图像 识别 实现 证照 电子 应用 模型 | ||
1.一种利用图像识别实现证照电子化的应用模型,其特征在于,
基于图像分析和OCR识别技术,通过对图像二值化处理和特征区域识别后,利用OCR识别技术对图像上的文字进行解析和规范化处理;
对证照图像特征进行分析处理;
读取中文文字库,识别证照图像中的文字,处理特殊字符,规范为key-value格式。
2.根据权利要求1所述的应用模型,其特征在于,
主要包括三个步骤,图像预处理、文字提取、信息映射三个步骤,
1)利用OpenCV对图像预处理去除噪声,提取出文字区域,提高识别效率;
2)借助Tesseract-OCR进行文字识别,并对识别结果作规范化处理;
3)读取证照模板的配置信息,与识别结果匹配,实现将证照图像信息映射到证照的电子模型中,并将证照的电子化结果进行存储。
3.根据权利要求2所述的应用模型,其特征在于,
图像预处理阶段是基于开源项目OpenCV实现的,首先,对用户上传的证照图像进行灰度化处理,选择[0,255]中适当的阈值作图像二值化处理;针对图像边缘的干扰,利用MSER算法进行连通区域特征检测,找出图像的稳定区域;最后,进行图像小区域筛选和链接,生成待识别的图像。
4.根据权利要求3所述的应用模型,其特征在于,
在文字提取阶段,将预处理过的图像送入开源的文字识别软件,Tesseract-OCR;Tesseract-OCR对图像进行布局分析,区分出图像的表格、图片、文本信息,之后利用字符间的间隔进行切分,依据中文字库等信息对文字进行解析,得出识别文本,从而生成初步的识别结果;系统在获取到初步的识别结果后,去除结果中的空格等特殊字符,对识别结果进行规范化,令识别结果按key-value的形式组织,返回处理后的识别结果。
5.根据权利要求4所述的应用模型,其特征在于,
信息映射阶段,获取证照模板的配置信息,确定证照上具有的信息以及这些信息在纸质版上的标识,利用信息标识与文字识别结果进行匹配,从而将识别到的文字映射到证照的模型中;匹配结束后,在软件界面中向用户展示生成的电子证照信息,由用户在必要时对电子证照进行人工校正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮云服务信息科技有限公司,未经山东浪潮云服务信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710099520.6/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序