[发明专利]金融电子传真文档识别系统及方法在审
| 申请号: | 201811046027.9 | 申请日: | 2018-09-07 |
| 公开(公告)号: | CN110889311A | 公开(公告)日: | 2020-03-17 |
| 发明(设计)人: | 白石;郭庆河;宋嘉琪;宫路;张怀朋;高海慧;石珍珍;王子芃 | 申请(专利权)人: | 上海怀若智能科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/34;G06K9/40;G06K9/62;G06Q40/00 |
| 代理公司: | 上海宏京知识产权代理事务所(普通合伙) 31297 | 代理人: | 邓文武 |
| 地址: | 200439 上海市宝山*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 金融 电子 传真 文档 识别 系统 方法 | ||
1.金融电子传真文档识别系统,其特征是包括服务器,所述服务器包括图像预处理模块、预处理图像数据库、目标检测模块、文字识别模块、数据合并模块,所述图像预处理模块包括图像校正模块、图像降噪模块,所述图像校正模块用于校正输入的图像,所述图像降噪模块用于将输入的图像降噪,所述预处理图像数据库用于存储、管理经预处理的图像,所述目标检测模块用于检测经预处理的图像的区域内容类型、坐标,所述文字识别模块用于对经预处理的图像的区域内容进行文字识别,所述数据合并模块用于处理、整合经预处理、识别的数据。
2.金融电子传真文档识别方法,所述金融电子传真文档识别方法基于金融电子传真文档识别系统,所述金融电子传真文档识别系统包括服务器,所述服务器包括图像预处理模块、预处理图像数据库、目标检测模块、文字识别模块、数据合并模块,所述图像预处理模块包括图像校正模块、图像降噪模块,其特征是包括步骤:
⑴图像校正模块将接收到的图像校正角度,图像降噪模块对经校正角度的图像进行降噪处理,图像校正模块调整经降噪处理的图像的大小、通道属性后存入预处理图像数据库;
⑵目标检测模块采用表格检测神经网络对经预处理的图像进行检测得到图像的区域数据类型、坐标发送给文字识别模块;
⑶文字识别模块根据收到的数据类型、坐标将经预处理的图像分割成多个小图像后采用文字识别精神网络进行文字识别得到图像的文本内容、坐标发送给数据合并模块;
⑷数据合并模块将收到的文本内容、坐标根据区域数据类型进行整合,序列化为指定的通信协议格式。
3.根据权利要求2所述的金融电子传真文档识别方法,其特征在于,预处理图像数据库是内存数据库,图像预处理模块将经预处理的图像存入内存,目标检测模块、文字识别模块从内存中读取图像的数据信息。
4.根据权利要求2所述的金融电子传真文档识别方法,其特征在于,步骤⑴中,图像校正模块将接收到图像采用vgg16卷积神经网络判断图像方向,将图像旋转为正向图像,图像降噪模块采用图像平均法将每个像素的值改变为像素与组成区域的区域像素的平均值,图像校正模块将降噪后的图片调整为单通道后存入预处理图像数据库中供后续使用。
5.根据权利要求2所述的金融电子传真文档识别方法,其特征在于,步骤⑵中,目标检测模块加载检测模型对图像进行目标检测,将检测到的图像区域类型与坐标输出,目标检测模块对表格坐标进行排序,删除与表格坐标重合的文本坐标,避免重复切割,按照剩余坐标将当前的图像分割成多个小图,将多个小图、坐标与类型组成json结构的数据发送给文字识别模块。
6.根据权利要求2所述的金融电子传真文档识别方法,其特征在于,步骤⑶中,文字识别模块采用vgg16卷积神经网络配合双向lstm神经网络,采用ctc时序分类进行序列解密,根据上下文信息对图像进行文字识别,文字识别模块首先加载识别模型,解析目标检测模块发送的json文件,然后对json文件中指定的图像进行文字识别,识别完成后将坐标与文本内容进行对应生成json格式的数据发送给数据合并模块。
7.根据权利要求2所述的金融电子传真文档识别方法,其特征在于,步骤⑷中,数据合并模块对文字识别模块发送的数据进行过滤、去重,首先将含有负值的坐标与文本删除,进行数据过滤,然后对数据进行排序,按照纵坐标与横坐标从小到大排序进行数据整合,将文本对应坐标按照原图位置进行还原。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海怀若智能科技有限公司,未经上海怀若智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811046027.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种医用雾化装置
- 下一篇:小区内切换重建立的方法及装置





