[发明专利]一种利用图像识别实现证照电子化的应用模型在审

专利信息
申请号: 201710099520.6 申请日: 2017-02-23
公开(公告)号: CN106886776A 公开(公告)日: 2017-06-23
发明(设计)人: 宁方刚;王冠军;陈兆亮 申请(专利权)人: 山东浪潮云服务信息科技有限公司
主分类号: G06K9/34 分类号: G06K9/34;G06K9/40;G06K9/46;G06T11/60
代理公司: 济南信达专利事务所有限公司37100 代理人: 姜明
地址: 250100 山东省济南市高*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 利用 图像 识别 实现 证照 电子 应用 模型
【权利要求书】:

1.一种利用图像识别实现证照电子化的应用模型,其特征在于,

基于图像分析和OCR识别技术,通过对图像二值化处理和特征区域识别后,利用OCR识别技术对图像上的文字进行解析和规范化处理;

对证照图像特征进行分析处理;

读取中文文字库,识别证照图像中的文字,处理特殊字符,规范为key-value格式。

2.根据权利要求1所述的应用模型,其特征在于,

主要包括三个步骤,图像预处理、文字提取、信息映射三个步骤,

1)利用OpenCV对图像预处理去除噪声,提取出文字区域,提高识别效率;

2)借助Tesseract-OCR进行文字识别,并对识别结果作规范化处理;

3)读取证照模板的配置信息,与识别结果匹配,实现将证照图像信息映射到证照的电子模型中,并将证照的电子化结果进行存储。

3.根据权利要求2所述的应用模型,其特征在于,

图像预处理阶段是基于开源项目OpenCV实现的,首先,对用户上传的证照图像进行灰度化处理,选择[0,255]中适当的阈值作图像二值化处理;针对图像边缘的干扰,利用MSER算法进行连通区域特征检测,找出图像的稳定区域;最后,进行图像小区域筛选和链接,生成待识别的图像。

4.根据权利要求3所述的应用模型,其特征在于,

在文字提取阶段,将预处理过的图像送入开源的文字识别软件,Tesseract-OCR;Tesseract-OCR对图像进行布局分析,区分出图像的表格、图片、文本信息,之后利用字符间的间隔进行切分,依据中文字库等信息对文字进行解析,得出识别文本,从而生成初步的识别结果;系统在获取到初步的识别结果后,去除结果中的空格等特殊字符,对识别结果进行规范化,令识别结果按key-value的形式组织,返回处理后的识别结果。

5.根据权利要求4所述的应用模型,其特征在于,

信息映射阶段,获取证照模板的配置信息,确定证照上具有的信息以及这些信息在纸质版上的标识,利用信息标识与文字识别结果进行匹配,从而将识别到的文字映射到证照的模型中;匹配结束后,在软件界面中向用户展示生成的电子证照信息,由用户在必要时对电子证照进行人工校正。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮云服务信息科技有限公司,未经山东浪潮云服务信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710099520.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top