[发明专利]票据分类方法、装置、设备及存储介质在审
申请号: | 202110134428.5 | 申请日: | 2021-01-29 |
公开(公告)号: | CN113011246A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 李金龙;文俊杰;钱学成;张佳炜;曹晓欢;陈洁彦 | 申请(专利权)人: | 招商银行股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/02;G06T5/00;G06T7/11 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 谢阅 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 票据 分类 方法 装置 设备 存储 介质 | ||
本申请公开了一种票据分类方法、装置、设备和存储介质,该方法包括:获取待处理票据数据,对所述待处理票据数据进行OCR识别处理,得到目标格式数据;将所述目标格式数据输入至预设票据识别模型中,基于所述预设票据识别模型对所述目标格式数据进行基于预设注意力机制的语义计算,得到各候选结果;基于各所述候选结果的大小,得到所述待处理票据数据的分类结果;其中,所述预设票据识别模型是基于具有预设分类标签的预设特征数据,并基于预设注意力机制,对预设基础模型进行迭代训练得到的。本实施例基于预设票据识别模型可以自动准确进行目标格式数据的处理,实现准确得到待处理票据数据的分类结果。
技术领域
本申请涉及金融科技(Fintech)的人工智能技术领域,尤其涉及一种票据分类方法、装置、设备及存储介质。
背景技术
随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术(如分布式、区块链Blockchain、人工智能等)应用在金融领域,但金融业也对技术提出了更高的要求,如金融业对票据分类也有更高的要求。
即随着金融监管力度和跨境贸易热度的加大,如何更快、更准地完成外汇业务的审核流程,成为约束银行提升服务性能的重要瓶颈之一,其中,准确识别外汇票据图片是外汇审核流程中首要的一环,目前,要依靠人工对票据进行外汇审核,受限于票据类型过多、结构繁杂,识别外汇票据的准确率不高。
发明内容
本申请的主要目的在于提供一种票据分类方法、装置、设备和存储介质,旨在解决现有技术中,外汇票据识别准确率不高的技术问题。
为实现上述目的,本申请提供一种票据分类方法,所述票据分类方法包括:
获取待处理票据数据,对所述待处理票据数据进行OCR识别处理,得到目标格式数据;
将所述目标格式数据输入至预设票据识别模型中,基于所述预设票据识别模型对所述目标格式数据进行基于预设注意力机制的语义计算,得到各候选结果;
基于各所述候选结果的大小,得到所述待处理票据数据的分类结果;
其中,所述预设票据识别模型是基于具有预设分类标签的预设特征数据,并基于预设注意力机制,对预设基础模型进行迭代训练得到的。
可选地,所述获取待处理票据数据,对所述待处理票据数据进行OCR识别处理,得到目标格式数据的步骤,包括:
获取待处理票据数据,对所述待处理票据数据进行图像灰度化、降噪、二值化、字符切分操作,得到预处理图像;
对所述预处理图像执行结构特征和文本特征的预设特征提取操作,得到包括所述预处理图像的布局特征和文本特征的目标格式数据。
可选地,所述注意力机制包括预设乘性注意力机制,所述将所述目标格式数据输入至预设票据识别模型中,基于所述预设票据识别模型对所述目标格式数据进行基于预设注意力机制的语义计算,得到各候选结果的步骤,包括:
将所述目标格式数据输入至预设票据识别模型中;
对所述目标格式数据进行特征编码和特征融合处理,得到嵌入向量数据;
基于预设乘性注意力机制所确定的嵌入向量数据对应的各嵌入权重,对所述嵌入向量数据进行预设语义特征提取处理,得到各候选结果。
可选地,所述对所述目标格式数据进行特征编码和特征融合处理,得到嵌入向量数据的步骤,包括:
对所述布局特征和文本特征分别进行矩阵形式的编码以及降维处理,得到布局编码数据和文本编码数据;
对所述布局编码数据和文本编码数据进行矩阵融合和向量化处理,得到嵌入向量数据。
可选地,所述预设基础模型为BERT模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于招商银行股份有限公司,未经招商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110134428.5/2.html,转载请声明来源钻瓜专利网。