[发明专利]一种票据处理自动生成凭证的方法及装置有效
| 申请号: | 201910604155.9 | 申请日: | 2019-07-05 |
| 公开(公告)号: | CN110414927B | 公开(公告)日: | 2023-04-07 |
| 发明(设计)人: | 张汉宁;苏斌;廖野;李煜;王长辉;杨宏德;刘鹏飞;杨南华;程术林;任会 | 申请(专利权)人: | 西安网算数据科技有限公司 |
| 主分类号: | G06Q10/10 | 分类号: | G06Q10/10;G06Q40/12;G06V30/42;G06V30/19;G06V10/82 |
| 代理公司: | 深圳峰诚志合知识产权代理有限公司 44525 | 代理人: | 杜翠鸣 |
| 地址: | 710000 陕西省西安市长安*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 票据 处理 自动 生成 凭证 方法 装置 | ||
1.一种票据处理自动生成凭证的方法,其特征在于,包括:
S1:连接扫描仪,获得票据图片集;
S2:根据得到的票据图片集,识别得到票据内容;
S3:根据票据内容进行票据分类,票据分类具体为:主营业务收入、办公费、租赁费、车辆使用费、差旅费、库存商品;
S4:获得凭证输出方式,包括生成单张票据的凭证、生成多张票据的凭证、生成某一票据分类的凭证和生成全部票据的凭证;
S5:根据凭证输出方式,得到预生成凭证的票据;
S6:根据票据内容得到目录类型,并根据目录类型、票据分类、纳税人类型、会计准则和减税税率准则获取对应的会计科目;如果步骤S4中凭证输出方式为生成多张票据的凭证、生成某一票据分类的凭证和生成全部票据的凭证,执行步骤S7;如果步骤S4中凭证输出方式为生成单张票据的凭证,执行步骤S8;
S7:获得票据合并方式,包括根据票据分类生成合并凭证或根据目录类型生成合并凭证,并根据票据合并方式对多张票据进行合并生成凭证;再执行步骤S9;
S8:生成凭证预览,并进行核查和编辑; 再执行步骤S9;
S9:保存凭证;
S10:保存编辑凭证信息;
其中,步骤S2具体为:
S101:票据种类识别:识别票据内容中的字段,并与关键字大数据库进行比对,提取票据的关键字,根据票据的关键字得到票据种类,票据种类包括增值税专用发票、增值税普通发票、火车票、银行对账单;
S102:同一票据种类的票据内容识别:根据票据种类,分别识别票据内容,保存票据内容;
所述票据内容识别具体为:
S1021:通过深度学习中的图片标注工具对票据图片集中的所有票据图片进行票据区域的标注,同时对每个票据区域标注其待识别字段区域和该区域所记载的字符信息,在标注好的票据图片集中,随机选取80%的票据图片形成训练样本集,将剩余20%的票据图片作为测试样本集;
S1022:将深度学习网络VGG-Net16的前4层作为基础网络层,并结合金字塔网络形成票据区域检测模型的网络结构,将训练样本集中的票据图片作为票据区域检测模型的输入,将标注的票据区域数据信息作为票据区域检测模型的输出,进行迭代训练,直到票据区域检测模型在测试样本集上的输出准确率大于预先给定的阈值,得到训练好的票据区域检测模型;
S1023:将深度学习网络VGG-Net16的前4层作为基础网络层,并结合金字塔网络形成待识别区域检测模型的网络结构,将训练样本集中的票据区域标注图片作为待识别区域检测模型的输入,将标注的待识别区域数据信息作为待识别区域检测模型的输出,进行迭代训练,直到待识别区域检测模型在测试样本集上的输出准确率大于预先给定的阈值,得到训练好的待识别区域检测模型;
S1024:以faster-rcnn作为网络结构,对待识别区域图片中的单个字符区域进行检测,得到单个字符区域图像;
S1025:以VGG-Net16作为网络结构,将单个字符区域图像作为输入,将待识别区域所记载的字符信息作为输出,进行待识别区域记载信息识别模型的训练,直到待识别区域记载信息识别模型在测试样本集上的输出准确率大于预先给定的阈值,得到训练好的待识别区域记载信息识别模型;
S1026:依次加载训练好的票据区域检测模型文件、待识别区域检测模型文件、待识别区域记载信息识别模型文件,并启动票据区域分割的Web接口服务,以Base64编码的形式返回每张票据区域图片的信息;
步骤S5还包括异常票据筛选,当票据为重复票据或者票据的税率计算不符合国家标准或开票时间不正常时,标记为异常票据,在后续步骤中不再处理。
2.根据权利要求1所述的一种票据处理自动生成凭证的方法,其特征在于,步骤S3根据票据内容进行票据分类具体为:
S201:根据票据内容的关键字组合和票据分类模板中的关键字组合进行比对,对票据进行分类;
S202:对票据分类进行核查,编辑票据分类信息;
S203:保存票据分类信息;
S204:更新票据分类模板。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安网算数据科技有限公司,未经西安网算数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910604155.9/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





