[发明专利]一种构建票据审核模型的方法在审
| 申请号: | 202010195820.6 | 申请日: | 2020-03-19 |
| 公开(公告)号: | CN111428103A | 公开(公告)日: | 2020-07-17 |
| 发明(设计)人: | 简仁贤;汤潘;马永宁 | 申请(专利权)人: | 竹间智能科技(上海)有限公司 |
| 主分类号: | G06F16/906 | 分类号: | G06F16/906;G06Q40/00 |
| 代理公司: | 北京挺立专利事务所(普通合伙) 11265 | 代理人: | 田黎绒 |
| 地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 构建 票据 审核 模型 方法 | ||
1.一种构建票据审核模型的方法,其特征在于:包括以下步骤,
步骤一、从预置数据库中调取与审核点对应的训练样本集,所述训练样本集中有多个训练样本数据,每个所述训练样本数据包括训练输入字段和训练输出字段;
步骤二、调取与审核点关联的模型,并以步骤一中的多个训练样本数据对模型进行训练;
步骤三、从预置数据库中调取与审核点对应的测试样本集,所述测试样本集中有多个测试样本数据,每个所述测试样本数据包括测试输入字段和测试输出字段;
步骤四、调取步骤二中训练完成的模型,并以步骤三中的多个测试样本数据对模型进行测试;若测试结果的准确率>阈值,则输出模型,所述准确率=预测正确测试样本数据总数/测试样本数据总数,所述阈值为60%~100%;
所述审核点包括审核输入字段和审核输出字段。
2.按照权利要求1所述的一种构建票据审核模型的方法,其特征在于:所述审核点的审核输入字段和审核输出字段均为string类型时,步骤二中调取的模型为分类模型。
3.按照权利要求2所述的一种构建票据审核模型的方法,其特征在于:所述分类模型为fasttext模型。
4.按照权利要求2或3所述的一种构建票据审核模型的方法,其特征在于:步骤四中,当一个测试输入字段输入的分类模型后,取所述分类模型输出的排序前五的五个字段,将该五个字段逐个与测试输出字段进行比对,若所述五个字段中有一个字段与测试输出字段相同,则记录一个预测正确测试样本数据数。
5.按照权利要求1所述的一种构建票据审核模型的方法,其特征在于:所述审核点的审核输入字段为string类型,且审核输出字段为float类型时,步骤二中调取的模型为统计模型。
6.按照权利要求5所述的一种构建票据审核模型的方法,其特征在于:在步骤一中,训练样本集中的多个训练样本数据的训练输入字段内容相同,在步骤三中,测试样本集中的多个测试样本数据的测试输入字段内容相同,且测试样本数据的测试输入字段内容与训练样本数据的训练输入字段内容相同;
所述统计模型在步骤二训练时,将对各所述训练样本数据的输出字段进行集合,获得集合C,对集合C计算均值mean和标准差std,以[mean-α*std,mean+α*std]为合理区间,其中α=3、3.5、4、4.5或5;
所述统计模型在步骤四测试时,对每个测试样本数据的测试输出字段进行判断,判断测试输出字段是否在合理区间[mean-α*std,mean+α*std]中,若在,则记录一个预测正确测试样本数据数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于竹间智能科技(上海)有限公司,未经竹间智能科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010195820.6/1.html,转载请声明来源钻瓜专利网。





