[发明专利]票据识别方法及装置在审
申请号: | 201910921362.7 | 申请日: | 2019-09-27 |
公开(公告)号: | CN110688998A | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 丁平;杨春明;郭铸 | 申请(专利权)人: | 中国银行股份有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06F9/54;G06K9/62 |
代理公司: | 11127 北京三友知识产权代理有限公司 | 代理人: | 薛平;谷敬丽 |
地址: | 100818 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 票据 数据元组 字段 票据识别 数据识别 真实数据 相似度 多应用场景 准确率 | ||
1.一种票据识别方法,其特征在于,包括:
获取待识别票据的OCR识别结果,其中,所述待识别票据中包含至少一个票据元素,每个票据元素中包含具有关联关系的多个字段,所述OCR识别结果包含所述待识别票据中每个票据元素包含的各个字段的数据识别结果;
根据所述OCR识别结果,获取每个票据元素对应的多个数据元组,其中,每个数据元组中包含相应字段的一个真实数据;
根据每个票据元素包含的各个字段的数据识别结果,以及每个票据元素对应的各个数据元组中相应字段的真实数据,计算每个票据元素与对应各个数据元组的相似度;
将每个票据元素对应的多个数据元组中,与每个票据元素相似度最大的数据元组,确定为每个票据元素的识别结果;
根据所述待识别票据中各个票据元素的识别结果,生成所述待识别票据的识别结果。
2.如权利要求1所述的方法,其特征在于,根据每个票据元素包含的各个字段的数据识别结果,以及每个票据元素对应的各个数据元组中相应字段的真实数据,计算每个票据元素与对应各个数据元组的相似度,包括:
根据每个票据元素包含的每个字段的数据识别结果与对应各个数据元组中相应字段的真实数据,计算每个票据元素包含的每个字段与对应各个数据元组中相应字段的相似度;
将每个票据元素包含的各个字段与对应各个数据元组中相应字段的相似度之和,确定为每个票据元素与对应各个数据元组的相似度。
3.如权利要求1所述的方法,其特征在于,在根据所述OCR识别结果,获取每个票据元素对应的多个数据元组之前,所述方法还包括:
根据所述OCR识别结果中每个票据元素包含的各个字段,从多个电子化系统中采集各个字段对应的多个真实数据;
根据各个字段对应的多个真实数据,生成每个票据元素对应的多个数据元组。
4.如权利要求1至3任一项所述的方法,其特征在于,获取待识别票据的OCR识别结果,包括:
采集所述待识别票据的票据图像;
采用OCR识别算法识别所述票据图像,得到所述待识别票据的OCR识别结果。
5.一种票据识别装置,其特征在于,包括:
票据OCR识别单元,用于获取待识别票据的OCR识别结果,其中,所述待识别票据中包含至少一个票据元素,每个票据元素中包含具有关联关系的多个字段,所述OCR识别结果包含所述待识别票据中每个票据元素包含的各个字段的数据识别结果;
数据元组获取单元,用于根据所述OCR识别结果,获取每个票据元素对应的多个数据元组,其中,每个数据元组中包含相应字段的一个真实数据;
数据相似度计算单元,用于根据每个票据元素包含的各个字段的数据识别结果,以及每个票据元素对应的各个数据元组中相应字段的真实数据,计算每个票据元素与对应各个数据元组的相似度;
数据相似度比对单元,用于将每个票据元素对应的多个数据元组中,与每个票据元素相似度最大的数据元组,确定为每个票据元素的识别结果;
票据识别结果生成单元,用于根据所述待识别票据中各个票据元素的识别结果,生成所述待识别票据的识别结果。
6.如权利要求5所述的装置,其特征在于,所述数据相似度计算单元包括:
第一计算模块,根据每个票据元素包含的每个字段的数据识别结果与对应各个数据元组中相应字段的真实数据,计算每个票据元素包含的每个字段与对应各个数据元组中相应字段的相似度;
第二计算模块,用于将每个票据元素包含的各个字段与对应各个数据元组中相应字段的相似度之和,确定为每个票据元素与对应各个数据元组的相似度。
7.如权利要求5所述的装置,其特征在于,所述装置还包括:
票据数据采集单元,用于根据所述OCR识别结果中每个票据元素包含的各个字段,从多个电子化系统中采集各个字段对应的多个真实数据;
票据数据处理单元,用于根据各个字段对应的多个真实数据,生成每个票据元素对应的多个数据元组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910921362.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种图像处理方法及装置
- 下一篇:马赫带效应模拟的点光源金属钢印文字检测方法