[发明专利]金融电子传真文档识别系统及方法在审

专利信息
申请号: 201811046027.9 申请日: 2018-09-07
公开(公告)号: CN110889311A 公开(公告)日: 2020-03-17
发明(设计)人: 白石;郭庆河;宋嘉琪;宫路;张怀朋;高海慧;石珍珍;王子芃 申请(专利权)人: 上海怀若智能科技有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/32;G06K9/34;G06K9/40;G06K9/62;G06Q40/00
代理公司: 上海宏京知识产权代理事务所(普通合伙) 31297 代理人: 邓文武
地址: 200439 上海市宝山*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 金融 电子 传真 文档 识别 系统 方法
【权利要求书】:

1.金融电子传真文档识别系统,其特征是包括服务器,所述服务器包括图像预处理模块、预处理图像数据库、目标检测模块、文字识别模块、数据合并模块,所述图像预处理模块包括图像校正模块、图像降噪模块,所述图像校正模块用于校正输入的图像,所述图像降噪模块用于将输入的图像降噪,所述预处理图像数据库用于存储、管理经预处理的图像,所述目标检测模块用于检测经预处理的图像的区域内容类型、坐标,所述文字识别模块用于对经预处理的图像的区域内容进行文字识别,所述数据合并模块用于处理、整合经预处理、识别的数据。

2.金融电子传真文档识别方法,所述金融电子传真文档识别方法基于金融电子传真文档识别系统,所述金融电子传真文档识别系统包括服务器,所述服务器包括图像预处理模块、预处理图像数据库、目标检测模块、文字识别模块、数据合并模块,所述图像预处理模块包括图像校正模块、图像降噪模块,其特征是包括步骤:

⑴图像校正模块将接收到的图像校正角度,图像降噪模块对经校正角度的图像进行降噪处理,图像校正模块调整经降噪处理的图像的大小、通道属性后存入预处理图像数据库;

⑵目标检测模块采用表格检测神经网络对经预处理的图像进行检测得到图像的区域数据类型、坐标发送给文字识别模块;

⑶文字识别模块根据收到的数据类型、坐标将经预处理的图像分割成多个小图像后采用文字识别精神网络进行文字识别得到图像的文本内容、坐标发送给数据合并模块;

⑷数据合并模块将收到的文本内容、坐标根据区域数据类型进行整合,序列化为指定的通信协议格式。

3.根据权利要求2所述的金融电子传真文档识别方法,其特征在于,预处理图像数据库是内存数据库,图像预处理模块将经预处理的图像存入内存,目标检测模块、文字识别模块从内存中读取图像的数据信息。

4.根据权利要求2所述的金融电子传真文档识别方法,其特征在于,步骤⑴中,图像校正模块将接收到图像采用vgg16卷积神经网络判断图像方向,将图像旋转为正向图像,图像降噪模块采用图像平均法将每个像素的值改变为像素与组成区域的区域像素的平均值,图像校正模块将降噪后的图片调整为单通道后存入预处理图像数据库中供后续使用。

5.根据权利要求2所述的金融电子传真文档识别方法,其特征在于,步骤⑵中,目标检测模块加载检测模型对图像进行目标检测,将检测到的图像区域类型与坐标输出,目标检测模块对表格坐标进行排序,删除与表格坐标重合的文本坐标,避免重复切割,按照剩余坐标将当前的图像分割成多个小图,将多个小图、坐标与类型组成json结构的数据发送给文字识别模块。

6.根据权利要求2所述的金融电子传真文档识别方法,其特征在于,步骤⑶中,文字识别模块采用vgg16卷积神经网络配合双向lstm神经网络,采用ctc时序分类进行序列解密,根据上下文信息对图像进行文字识别,文字识别模块首先加载识别模型,解析目标检测模块发送的json文件,然后对json文件中指定的图像进行文字识别,识别完成后将坐标与文本内容进行对应生成json格式的数据发送给数据合并模块。

7.根据权利要求2所述的金融电子传真文档识别方法,其特征在于,步骤⑷中,数据合并模块对文字识别模块发送的数据进行过滤、去重,首先将含有负值的坐标与文本删除,进行数据过滤,然后对数据进行排序,按照纵坐标与横坐标从小到大排序进行数据整合,将文本对应坐标按照原图位置进行还原。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海怀若智能科技有限公司,未经上海怀若智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811046027.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top