[发明专利]文档识别方法、装置及设备在审
| 申请号: | 202010265465.5 | 申请日: | 2020-04-07 |
| 公开(公告)号: | CN111507214A | 公开(公告)日: | 2020-08-07 |
| 发明(设计)人: | 杨猛;邵利铎;鹿慧;何栋;于灏;孟庆峰;刘松;刘皓;蔡雨佳;尹磊;张大鹏;肖潇;邸杰;王龙涛;张晓奇 | 申请(专利权)人: | 中国人民财产保险股份有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34 |
| 代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 朱文杰 |
| 地址: | 100022 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文档 识别 方法 装置 设备 | ||
本说明书实施例提供了一种文档识别方法、装置及设备,其中,方法包括:采集目标业务对应的综合文档图像,所述综合文档图像中的综合文档包含执行所述目标业务所需的至少一个独立文档;对所述综合文档图像中包含的独立文档进行定位分割,以确定各所述独立文档在所述综合文档图像中的位置;对各所述独立文档所在位置的图像进行文本识别,确定所述独立文档中所包含的文本内容。本说明书实施例通过采集综合文档图像,并对其进行定位分割以及文本识别,提高对多个独立文档的识别速度,进而提高目标业务的执行效率。
技术领域
本文件涉及图像处理领域,尤其涉及一种文档识别方法、装置及设备。
背景技术
在各种金融、报销、政府、服务等业务办理中都需要提供各种文档原件或者复印件,有的还可以提供电子件。例如:银行业务、保险业务、财务报销等。现阶段各种业务环节涉及的文档都需要人工采集后对提交的文档进行分类,调用不同的文档识别模块进行识别和结构化,然后存入数据库。
在识别过程中,各种文档需要相互分开单独识别,即使所提交的文档很小,能够在一张图上放置多个文档,一般也要一次提交一个文档。这样一个业务流程会变得繁琐。
发明内容
本说明书提供了一种文档识别方法、装置及设备,用以解决现有技术中在针对多个文档进行识别时,识别效率低的问题。
为达到上述目的,本发明的实施例采用如下技术方案:
第一方面,本说明书实施例提供了一种文档识别方法,包括:
采集目标业务对应的综合文档图像,所述综合文档图像中的综合文档包含执行所述目标业务所需的至少一个独立文档;
对所述综合文档图像中包含的独立文档进行定位分割,以确定各所述独立文档在所述综合文档图像中的位置;
对各所述独立文档所在位置的图像进行文本识别,确定所述独立文档中所包含的文本内容。
第二方面,本说明书实施例提供了一种文档识别装置,包括:
图像采集模块,采集目标业务对应的综合文档图像,所述综合文档图像中的综合文档包含执行所述目标业务所需的至少一个独立文档;
文档分割模块,对所述综合文档图像中包含的独立文档进行定位分割,以确定各所述独立文档在所述综合文档图像中的位置;
文档识别模块,对各所述独立文档所在位置的图像进行文本识别,确定所述独立文档中所包含的文本内容。
第三方面,本说明书实施例提供了一种文档识别设备,包括:
处理器;以及,
被安排成存储计算机可执行指令的存储器,所述计算机可执行指令在被执行时使所述处理器:
采集目标业务对应的综合文档图像,所述综合文档图像中的综合文档包含执行所述目标业务所需的至少一个独立文档;
对所述综合文档图像中包含的独立文档进行定位分割,以确定各所述独立文档在所述综合文档图像中的位置;
对各所述独立文档所在位置的图像进行文本识别,确定所述独立文档中所包含的文本内容。
第四方面,本说明书实施例提供了一种存储介质。该存储介质用于存储计算机可执行指令。所述计算机可执行指令在被执行时实现以下流程:
采集目标业务对应的综合文档图像,所述综合文档图像中的综合文档包含执行所述目标业务所需的至少一个独立文档;
对所述综合文档图像中包含的独立文档进行定位分割,以确定各所述独立文档在所述综合文档图像中的位置;
对各所述独立文档所在位置的图像进行文本识别,确定所述独立文档中所包含的文本内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民财产保险股份有限公司,未经中国人民财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010265465.5/2.html,转载请声明来源钻瓜专利网。





