[发明专利]票据分类方法、票据分类装置、电子设备和存储介质在审
申请号: | 202111487358.8 | 申请日: | 2021-12-07 |
公开(公告)号: | CN114140649A | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 李虎;吴松霖;李睿之;郑邦东;熊博颖 | 申请(专利权)人: | 中国建设银行股份有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06N3/04;G06V30/412 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 陈文卓 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 票据 分类 方法 装置 电子设备 存储 介质 | ||
本公开提供了一种票据分类方法及装置,可以应用于人工智能技术领域和金融领域。该票据分类方法包括:获取待分类票据图像,其中,待分类票据图像是对初始票据图像进行剪裁而生成的;将待分类票据图像输入预先训练完成的票据识别模型,输出第一识别结果,其中,第一识别结果包括待分类票据图像中的文本位置和文本内容;基于第一识别结果,从票据模板库中确定与第一识别结果相匹配的目标票据模板,其中,票据模板库中的票据模板的尺寸与待分类票据图像的尺寸相对应;以及根据目标票据模板生成分类结果。此外,本公开还提供了一种票据分类装置、一种电子设备、一种可读存储介质和一种计算机程序产品。
技术领域
本公开涉及人工智能技术领域和金融领域,更具体地,涉及一种票据分类方法、装置、电子设备、计算机可读存储介质和计算机程序产品。
背景技术
票据图像的分类方法主要包括传统图像法和深度学习法,传统图像法主要是通过人工设置一些图像特征来进行匹配。传统图像法由于其准确率不高而逐渐被其他方法取代。
深度学习法主要包括图像分类法和目标检测法。图像分类法是指利用卷积神经网络后接Softmax搭建分类器,从而直接输出票据类别;目标检测法是指利用卷积神经网络搭建检测器来检测多个定位标,从而输出票据类别。
在实现本公开构思的过程中,发明人发现相关技术中的基于深度学习法的票据图像分类方法是基于训练完成的深度学习模型进行的,而由于深度学习模型是根据训练预期所包括的识别类别所训练的,网络结构与识别类别相适应,当需要新增识别类别时,则需要对深度学习模型进行重新训练,并且新增识别类别数越多,需要的训练数据就越大。因而,亟需一种在新增类别的情况下无需重新训练并且分类速度满足实际应用需求的票据分类方法。
发明内容
有鉴于此,本公开提供了一种票据分类方法、一种票据分类装置、一种电子设备、一种计算机可读存储介质和一种计算机程序产品。
作为本公开的第一个方面,提供了一种票据分类方法,包括:
获取待分类票据图像,其中,上述待分类票据图像是对初始票据图像进行剪裁而生成的;
将上述待分类票据图像输入预先训练完成的票据识别模型,输出第一识别结果,其中,上述第一识别结果包括上述待分类票据图像中的文本位置和文本内容;
基于上述第一识别结果,从票据模板库中确定与上述第一识别结果相匹配的目标票据模板,其中,上述票据模板库中的票据模板的尺寸与上述待分类票据图像的尺寸相对应;以及
根据上述目标票据模板生成分类结果。
根据本公开的实施例,其中,上述票据模板库中的票据模板具有票据标题信息,上述标题信息包括标题位置信息和标题内容信息;
在上述基于上述第一识别结果,从票据模板库中确定与上述第一识别结果相匹配的目标票据模板之前,还包括:
对上述票据标题信息和上述第一识别结果进行匹配,生成匹配结果;
在上述匹配结果表征上述第一识别结果和上述票据标题信息具有匹配关系的情况下,基于上述第一识别结果,从票据模板库中确定与上述识别结果相匹配的目标票据模板。
根据本公开的实施例,还包括:
在上述匹配结果表征上述识别结果和上述票据标题信息不具有匹配关系的情况下,将上述初始票据图像输入预先训练完成的票据识别模型,输出第二识别结果,其中,上述第二识别结果包括上述初始票据图像中的文本位置和文本内容;
基于上述第二识别结果,从票据模板库中确定与上述第二识别结果相匹配的目标票据模板;以及
根据上述目标票据模板生成分类结果。
根据本公开的实施例,还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国建设银行股份有限公司,未经中国建设银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111487358.8/2.html,转载请声明来源钻瓜专利网。