[发明专利]金融电子传真文档识别系统及方法在审
| 申请号: | 201811046027.9 | 申请日: | 2018-09-07 |
| 公开(公告)号: | CN110889311A | 公开(公告)日: | 2020-03-17 |
| 发明(设计)人: | 白石;郭庆河;宋嘉琪;宫路;张怀朋;高海慧;石珍珍;王子芃 | 申请(专利权)人: | 上海怀若智能科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06K9/34;G06K9/40;G06K9/62;G06Q40/00 |
| 代理公司: | 上海宏京知识产权代理事务所(普通合伙) 31297 | 代理人: | 邓文武 |
| 地址: | 200439 上海市宝山*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 金融 电子 传真 文档 识别 系统 方法 | ||
本发明涉及一种金融电子传真文档识别系统,包括服务器,服务器包括图像预处理模块、预处理图像数据库、目标检测模块、文字识别模块、数据合并模块,图像预处理模块包括图像校正模块、图像降噪模块。本发明还公开了一种金融电子传真文档识别方法,包括图像预处理、图像检测、图像文字识别、数据合并等过程。本发明采用人工智能进行金融交易类具有噪音的图片的智能处理、识别,具有识别效率、质量高的特点。
技术领域
本发明涉及一种文档识别系统及方法,特别涉及一种金融电子传真文档识别系统及方法,属于金融管理领域。
背景技术
目前,金融领域的传真文件采用人工录入,在交易高峰期无法有效大批量的录入传真文件,延长了整体的交易时间,延缓了交易时间,所以,金融领域对提高效率产生了急迫的需求。目前,市面上的文字识别系统只能对自然场景中的文字进行识别,无法处理由传真机、扫描仪等设备生成的图片。传真机、扫描仪生成的图片会产生有别于自然场景的噪音,而且,金融行业的交易文档大部分为表格形式的图片,表格的分割与检测也让市面上现有的文字识别系统无能为力。
发明内容
本发明金融电子传真文档识别系统及方法公开了新的方案,采用人工智能进行金融交易类具有噪音的图片的智能处理、识别,解决了现有方案采用人工或普通文字识别系统带来的识别效率低、质量不高的问题。
本发明金融电子传真文档识别系统包括服务器,服务器包括图像预处理模块、预处理图像数据库、目标检测模块、文字识别模块、数据合并模块,图像预处理模块包括图像校正模块、图像降噪模块,图像校正模块用于校正输入的图像,图像降噪模块用于将输入的图像降噪,预处理图像数据库用于存储、管理经预处理的图像,目标检测模块用于检测经预处理的图像的区域内容类型、坐标,文字识别模块用于对经预处理的图像的区域内容进行文字识别,数据合并模块用于处理、整合经预处理、识别的数据。
本发明还公开了一种金融电子传真文档识别方法,金融电子传真文档识别方法基于金融电子传真文档识别系统,金融电子传真文档识别系统包括服务器,服务器包括图像预处理模块、预处理图像数据库、目标检测模块、文字识别模块、数据合并模块,图像预处理模块包括图像校正模块、图像降噪模块。方法包括步骤:⑴图像校正模块将接收到的图像校正角度,图像降噪模块对经校正角度的图像进行降噪处理,图像校正模块调整经降噪处理的图像的大小、通道属性后存入预处理图像数据库;⑵目标检测模块采用表格检测神经网络对经预处理的图像进行检测得到图像的区域数据类型、坐标发送给文字识别模块;⑶文字识别模块根据收到的数据类型、坐标将经预处理的图像分割成多个小图像后采用文字识别精神网络进行文字识别得到图像的文本内容、坐标发送给数据合并模块;⑷数据合并模块将收到的文本内容、坐标根据区域数据类型进行整合,序列化为指定的通信协议格式。
进一步,本方案方法的预处理图像数据库是内存数据库,图像预处理模块将经预处理的图像存入内存,目标检测模块、文字识别模块从内存中读取图像的数据信息。
进一步,本方案方法的步骤⑴中,图像校正模块将接收到图像采用vgg16卷积神经网络判断图像方向,将图像旋转为正向图像,图像降噪模块采用图像平均法将每个像素的值改变为像素与组成区域的区域像素的平均值,图像校正模块将降噪后的图片调整为单通道后存入预处理图像数据库中供后续使用。
进一步,本方案方法的步骤⑵中,目标检测模块加载检测模型对图像进行目标检测,将检测到的图像区域类型与坐标输出,目标检测模块对表格坐标进行排序,删除与表格坐标重合的文本坐标,避免重复切割,按照剩余坐标将当前的图像分割成多个小图,将多个小图、坐标与类型组成json结构的数据发送给文字识别模块。
进一步,本方案方法的步骤⑶中,文字识别模块采用vgg16卷积神经网络配合双向lstm神经网络,采用ctc时序分类进行序列解密,根据上下文信息对图像进行文字识别,文字识别模块首先加载识别模型,解析目标检测模块发送的json文件,然后对json文件中指定的图像进行文字识别,识别完成后将坐标与文本内容进行对应生成json格式的数据发送给数据合并模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海怀若智能科技有限公司,未经上海怀若智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811046027.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种医用雾化装置
- 下一篇:小区内切换重建立的方法及装置





