[发明专利]一种针对无固定格式模板消费凭据的自动审核方法及装置在审
| 申请号: | 202011519262.0 | 申请日: | 2020-12-21 |
| 公开(公告)号: | CN112541461A | 公开(公告)日: | 2021-03-23 |
| 发明(设计)人: | 卫浩 | 申请(专利权)人: | 四川新网银行股份有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06Q10/10;G06F16/951;G06F40/284;G06N20/00 |
| 代理公司: | 成都智言知识产权代理有限公司 51282 | 代理人: | 濮云杉 |
| 地址: | 610094 四川省成都市成都*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 针对 固定 格式 模板 消费 凭据 自动 审核 方法 装置 | ||
本发明涉及计算机视觉识别领域,公开了一种针对无固定格式模板消费凭据的自动审核方法及装置,包括以下步骤:步骤1:建立样本库;步骤2:构建识别模型和训练;步骤3:输入消费凭据影像件,通过识别模型进行特征识别确定消费凭据类型,若未成功识别,则输出不确定,转人工审核,若成功识别消费凭据类型,各类消费凭据分别进行审核,然后输出不通过审核或通过审核。本发明可实现针对无固定格式模板针对无固定格式模板消费凭据的识别,将无固定格式模板的消费凭据进行识别分类,然后进行审核,将识别出来的不同消费凭据分别审核,将不能识别出来的消费凭据由人工逐一审核,大大降低了投入的人力和物力。
技术领域
本发明涉及计算机视觉识别领域,具体是指一种针对无固定格式模板消费凭据的自动审核方法及装置。
背景技术
近年来,随着深度学习等计算机视觉技术的快速发展,图片识别技术和OCR技术等已被广泛应用到人脸识别、证照识别等领域,在特定对象识别方面如标准化的证照方面已发展比较成熟。
但是,目前计算机视觉识别技术对于非标准化的文件,在识别上还是存在较大误差,甚至可能无法识别。以申请人所在的工作场景为例,在某些场景下,如银行发放贷款时需要对客户提供的消费凭据影像件进行审核,审核提供的影像件是否为真实的消费凭据。消费凭据中除发票有较为标准的格式外,其他消费凭据如购买合同、收款收据等都没有标准格式和固定格式模板,现有技术方案是利用标准化的发票OCR工具对发票进行识别,对非标准化消费凭据部分主要依赖于人工逐个审,总体上需要投入较多的人力和物力。
因此我们迫切需要一种能够节省人力和物力的,适用于无固定格式模板针对无固定格式模板消费凭据的审核方法及装置。
发明内容
基于以上问题,本发明提供了一种针对无固定格式模板消费凭据的自动审核方法及装置。本发明可实现针对无固定格式模板针对无固定格式模板消费凭据的识别,将无固定格式模板的消费凭据进行识别分类,然后进行审核,将识别出来的不同消费凭据分别审核,将不能识别出来的消费凭据由人工逐一审核,大大降低了投入的人力和物力。
为解决以上技术问题,本发明采用的技术方案如下:
一种针对无固定格式模板消费凭据的统一自动审核方法,包括以下步骤:
步骤1:建立样本库;
步骤2:构建识别模型和训练;
步骤3:输入消费凭据影像件,通过识别模型进行特征识别确定消费凭据类型,若未成功识别,则输出不确定,转人工审核,若成功识别消费凭据类型,各类消费凭据分别进行审核,然后输出不通过审核或通过审核。
优选的,在步骤1中包括以下步骤:
步骤1.1:获取影像化消费凭据;
步骤1.2:针对步骤1.1中获取到的样本目标标签标注,标注内容为凭据类型;
步骤1.3:对影像化消费凭据,识别文字内容并保存;
步骤1.4:对步骤1.3中获取到的文字内容进行分词,并统计词频,将词语和词频形成词语-词频的特征、以及词频比例特征;
步骤1.5:将步骤4中获取到的文本词进行向量化编码。
优选的,在步骤1.1中获取影像化消费凭据的方式为通过设备直接输入或者通过互联网上对各类消费凭据图片爬取。
优选的,在步骤1.1中在互联网获取影像化消费凭据的同时随机爬取干扰图片加入样本库。
优选的,在步骤1.2中凭据类型包括发票、合同、收据、其他非消费凭据。
优选的,在步骤1.3中,影像化消费凭据识别采用OCR识别技术。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川新网银行股份有限公司,未经四川新网银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011519262.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种车辆再识别方法及系统
- 下一篇:一种地铁信号模拟检测方法和系统





