[发明专利]一种针对无固定格式模板消费凭据的自动审核方法及装置在审
| 申请号: | 202011519262.0 | 申请日: | 2020-12-21 |
| 公开(公告)号: | CN112541461A | 公开(公告)日: | 2021-03-23 |
| 发明(设计)人: | 卫浩 | 申请(专利权)人: | 四川新网银行股份有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06Q10/10;G06F16/951;G06F40/284;G06N20/00 |
| 代理公司: | 成都智言知识产权代理有限公司 51282 | 代理人: | 濮云杉 |
| 地址: | 610094 四川省成都市成都*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 针对 固定 格式 模板 消费 凭据 自动 审核 方法 装置 | ||
1.一种针对无固定格式模板消费凭据的统一自动审核方法,其特征在于,包括以下步骤:
步骤1:建立样本库;
步骤2:构建识别模型和训练;
步骤3:输入消费凭据影像件,通过识别模型进行特征识别确定消费凭据类型,若未成功识别,则输出不确定,转人工审核,若成功识别消费凭据类型,各类消费凭据分别进行审核,然后输出不通过审核或通过审核。
2.根据权利要求1所述的针对无固定格式模板消费凭据的统一自动审核方法,其特征在于,在步骤1中包括以下步骤:
步骤1.1:获取影像化消费凭据;
步骤1.2:针对步骤1.1中获取到的样本目标标签标注,标注内容为凭据类型;
步骤1.3:对影像化消费凭据,识别文字内容并保存;
步骤1.4:对步骤1.3中获取到的文字内容进行分词,并统计词频,将词语和词频形成词语-词频的特征以及词频比例特征;
步骤1.5:将步骤4中获取到的文本词进行向量化编码。
3.根据权利要求2所述的针对无固定格式模板消费凭据的统一自动审核方法,其特征在于:在步骤1.1中获取影像化消费凭据的方式为通过设备直接输入或者通过互联网上对各类消费凭据图片爬取。
4.根据权利要求2所述的针对无固定格式模板消费凭据的统一自动审核方法,其特征在于:在步骤1.1中在互联网获取影像化消费凭据的同时随机爬取干扰图片加入样本库。
5.根据权利要求2所述的针对无固定格式模板消费凭据的统一自动审核方法,其特征在于:在步骤1.2中凭据类型包括发票、合同、收据、其他非消费凭据。
6.根据权利要求2所述的针对无固定格式模板消费凭据的统一自动审核方法,其特征在于:在步骤1.3中,影像化消费凭据识别采用OCR识别技术。
7.根据权利要求2所述的针对无固定格式模板消费凭据的统一自动审核方法,其特征在于:在步骤2中:通过多分类机器学习模型进行训练,输入标准样本,输出各类消费凭据概率,得到识别模型。
8.一种针对无固定格式模板消费凭据的统一自动审核装置,其特征在于:采用权利要求1-7所述的针对无固定格式模板消费凭据的统一自动审核方法进行审核。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川新网银行股份有限公司,未经四川新网银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011519262.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种车辆再识别方法及系统
- 下一篇:一种地铁信号模拟检测方法和系统





