[发明专利]一种票据识别方法及装置有效
申请号: | 202010873968.0 | 申请日: | 2020-08-26 |
公开(公告)号: | CN111931687B | 公开(公告)日: | 2022-03-15 |
发明(设计)人: | 邓练兵;宋宇轩;方文佳 | 申请(专利权)人: | 珠海大横琴科技发展有限公司 |
主分类号: | G06V30/413 | 分类号: | G06V30/413 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 胡晓静 |
地址: | 519000 广东省珠海市横琴新*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 票据 识别 方法 装置 | ||
1.一种票据识别方法,其特征在于,包括:
获取待处理图像;其中,所述待处理图像中包括票据图像,所述票据图像中包括多个票据元素;
根据预设的票据元素样本集合和所述待处理图像对应的字符识别信息,确定所述票据图像中的至少一个第一票据元素的识别结果;其中,所述识别结果包括所述第一票据元素对应的元素类型、语义信息和位置特征;
根据所述第一票据元素的识别结果中的位置特征,确定与所述第一票据元素存在位置关联关系的至少一个第二票据元素对应的目标区域;
根据所述目标区域对应的字符识别信息,确定所述第二票据元素的识别结果;
根据所述第一票据元素的识别结果和至少一个第二票据元素的识别结果,生成票据识别结果;
其中,所述根据预设的票据元素样本集合和所述待处理图像对应的字符识别信息,确定所述票据图像中的至少一个第一票据元素的识别结果,包括:
计算所述字符识别信息中的各字段与所述票据元素样本集合中各样本的相似度,根据所述相似度从大到小的排序结果,确定第一目标样本和所述第一目标样本对应的第一票据元素;
根据所述第一目标样本对应的元素类型,确定所述第一票据元素的元素类型;
根据所述第一目标样本对应的位置特征,确定所述第一票据元素的位置特征;
根据所述字符识别信息,确定所述第一票据元素的语义信息;
所述根据所述第一票据元素的识别结果中的位置特征,确定与所述第一票据元素存在位置关联关系的至少一个第二票据元素对应的目标区域,包括:
在所述票据元素样本集合中,确定至少一个与所述第一目标样本存在位置关联关系的第二目标样本;根据所述第二目标样本对应的位置特征,确定所述第二票据元素对应的目标区域;
其中,所述计算所述字符识别信息中的各字段与所述票据元素样本集合中各样本的相似度,包括:
根据所述字段的字符长度和首字符,计算该字段与所述票据元素样本集合中各样本的相似度。
2.根据权利要求1所述的票据识别方法,其特征在于,所述根据所述目标区域对应的字符识别信息,确定所述第二票据元素的识别结果,包括:
在所述字符识别信息中提取与所述目标区域的位置对应的字段,以确定所述第二票据元素的语义信息;
根据所述第二目标样本对应的元素类型,确定所述第二票据元素的元素类型;
根据所述第二目标样本对应的位置特征,确定所述第二票据元素的位置特征。
3.根据权利要求1所述的票据识别方法,其特征在于,在根据预设的票据元素样本集合和所述待处理图像对应的字符识别信息,确定所述票据图像中的至少一个第一票据元素的识别结果之前,所述方法还包括:
对所述待处理图像进行OCR识别,以获得所述待处理图像对应的字符识别信息。
4.根据权利要求3所述的票据识别方法,其特征在于,在对所述待处理图像进行OCR识别之前,所述方法还包括:
对所述待处理图像进行二值化处理,以获得所述待处理图像对应的二值化图像;
对所述二值化图像进行连通区域分析,以获得所述二值化图像对应的文本区域,
根据所述文本区域中的文本方向,确定所述二值化图像的待旋转角度和旋转方向;
根据所述待旋转角度和旋转方向,对所述二值化图像进行位置调整。
5.根据权利要求4所述的票据识别方法,其特征在于,在对所述待处理图像进行二值化处理之前,所述方法还包括:
对所述待处理图像依次进行灰度处理、高斯滤波处理和去噪声处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海大横琴科技发展有限公司,未经珠海大横琴科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010873968.0/1.html,转载请声明来源钻瓜专利网。