[发明专利]一种构建票据审核模型的方法在审
申请号: | 202010195820.6 | 申请日: | 2020-03-19 |
公开(公告)号: | CN111428103A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 简仁贤;汤潘;马永宁 | 申请(专利权)人: | 竹间智能科技(上海)有限公司 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06Q40/00 |
代理公司: | 北京挺立专利事务所(普通合伙) 11265 | 代理人: | 田黎绒 |
地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 构建 票据 审核 模型 方法 | ||
本发明公开了一种构建票据审核模型的方法,包括以下步骤,步骤一、从预置数据库中调取与审核点对应的训练样本集;步骤二、调取与审核点关联的模型,并以步骤一中的多个训练样本数据对模型进行训练;步骤三、从预置数据库中调取与审核点对应的测试样本集;步骤四、调取步骤二中训练完成的模型,并以步骤三中的多个测试样本数据对模型进行测试;若测试结果的准确率>阈值,则输出模型,所述准确率=预测正确测试样本数据总数/测试样本数据总数,所述阈值为60%~100%;所述审核点包括审核输入字段和审核输出字段。本发明构建出的票据审核模型能够显著减少人工审核票据的劳动强度。
技术领域
本发明属于计算机技术领域,尤其涉及一种构建票据审核模型的方法。
背景技术
在当前数字化时代财务系统已经实现单据、发票、影像、审核等数据的结构化。包括积累的发票审核要点、组织架构、核算规则及人员等多方面信息。
当前财务部门针对部分财务审核点(比如账单金额、费用类型)在业务规则的基础上制定简单的规则进行过滤。其缺点在于不能很好地处理复杂业务审核点,不能达到显著减少人工审核。原因在于缺少一套工具,将具有高度业务逻辑、经验的信息构建成模型,辅助人工审核。
发明内容
本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种构建票据审核模型的方法,构建出的票据审核模型能够显著减少人工审核票据的劳动强度。
为解决上述技术问题,本发明采用的技术方案是:一种构建票据审核模型的方法,包括以下步骤,
步骤一、从预置数据库中调取与审核点对应的训练样本集,所述训练样本集中有多个训练样本数据,每个所述训练样本数据包括训练输入字段和训练输出字段;
步骤二、调取与审核点关联的模型,并以步骤一中的多个训练样本数据对模型进行训练;
步骤三、从预置数据库中调取与审核点对应的测试样本集,所述测试样本集中有多个测试样本数据,每个所述测试样本数据包括测试输入字段和测试输出字段;
步骤四、调取步骤二中训练完成的模型,并以步骤三中的多个测试样本数据对模型进行测试;若测试结果的准确率>阈值,则输出模型,所述准确率=预测正确测试样本数据总数/测试样本数据总数,所述阈值为60%~100%;
所述审核点包括审核输入字段和审核输出字段。
上述一种构建票据审核模型的方法,所述审核点的审核输入字段和审核输出字段均为string类型时,步骤二中调取的模型为分类模型。
上述一种构建票据审核模型的方法,所述分类模型为fasttext模型。
上述一种构建票据审核模型的方法,步骤四中,当一个测试输入字段输入的分类模型后,取所述分类模型输出的排序前五的五个字段,将该五个字段逐个与测试输出字段进行比对,若所述五个字段中有一个字段与测试输出字段相同,则记录一个预测正确测试样本数据数。
上述一种构建票据审核模型的方法,所述审核点的审核输入字段为string类型,且审核输出字段为float类型时,步骤二中调取的模型为统计模型。
上述一种构建票据审核模型的方法,在步骤一中,训练样本集中的多个训练样本数据的训练输入字段内容相同,在步骤三中,测试样本集中的多个测试样本数据的测试输入字段内容相同,且测试样本数据的测试输入字段内容与训练样本数据的训练输入字段内容相同;
所述统计模型在步骤二训练时,将对各所述训练样本数据的输出字段进行集合,获得集合C,对集合C计算均值mean和标准差std,以[mean-α*std,mean+α*std]为合理区间,其中α=3、3.5、4、4.5或5;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于竹间智能科技(上海)有限公司,未经竹间智能科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010195820.6/2.html,转载请声明来源钻瓜专利网。