[发明专利]一种高度自动化的票据分类方法及系统有效
| 申请号: | 202010399377.4 | 申请日: | 2020-05-12 |
| 公开(公告)号: | CN111597958B | 公开(公告)日: | 2023-04-07 |
| 发明(设计)人: | 张汉宁;苏斌;杨芳;徐博;田福康;任会 | 申请(专利权)人: | 西安网算数据科技有限公司 |
| 主分类号: | G06V30/413 | 分类号: | G06V30/413;G06V30/19;G06V10/82 |
| 代理公司: | 石家庄领皓专利代理有限公司 13130 | 代理人: | 任军培 |
| 地址: | 710000 陕西省西安市*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 高度 自动化 票据 分类 方法 系统 | ||
1.一种高度自动化的票据分类方法,其特征在于:包括分类模型训练的步骤,所述分类模型训练的步骤包括
获得票据样本集A;
配置基础网络模块(300)对票据样本集A进行特征提取,输出特征图一(302);
配置G-Stream模块(310)关注全局信息,所述G-Stream模块(310)包括依次连接的卷积层一、全卷积模块一(311)和损失函数一计算模块,
所述卷积层一的输入为特征图一(302),所述损失函数一计算模块用于计算损失函数一lossg;
配置P-Stream模块(320)关注局部关键信息,所述P-Stream模块(320)包括依次连接的卷积层二、全局最大池化模块、全卷积模块二(322)和损失函数二计算模块,
所述卷积层二的输入为特征图一(302),所述全局最大池化模块的输出为特征图二(321),所述损失函数二计算模块用于计算损失函数二lossp;
配置S-Stream监督模块(330),所述S-Stream监督模块(330)包括依次连接的平均池化模块三和损失函数三计算模块,
所述平均池化模块三的输入为特征图二(321),所述损失函数三计算模块用于计算损失函数三losss;
根据损失函数一lossg、损失函数二lossp和损失函数三losss计算总损失函数losstotal,具体为:
losstotal=λ*lossg+β*lossp+γ*losss
其中,λ、β、γ为权重系数;
判断总损失函数losstotal是否达到设定阈值,如果是,则分类模型训练的步骤完成,得到票据分类模型D,否则调整基础网络模块(300)、G-Stream模块(310)、P-Stream模块(320)和S-Stream监督模块(330)的参数,重新执行所述分类模型训练的步骤。
2.根据权利要求1所述的一种高度自动化的票据分类方法,其特征在于:损失函数一lossg、损失函数二lossp和损失函数三losss的计算均采用L-Softmax函数,其中,损失函数一lossg的计算过程具体为:
S121:计算特征向量xi与权重Wyi的夹角:
其中:特征向量xi为全卷积模块一(311)的输出,xi对应的标签是yi,xi对应的权重是Wyi;
S122:计算mθyi倍角度的余弦值:
其中,m用来调节训练难度,m∈N*;
S123:计算ψ(θyi):
ψ(θyi)=(-1)k*cos(mθyi)-2*k
其中:
S124:计算损失函数一lossg:
3.根据权利要求1所述的一种高度自动化的票据分类方法,其特征在于:所述全卷积模块一(311)包括依次连接的卷积层三、BN、ReLU和平均池化模块一,
所述卷积层三的输入与卷积层一连接,平均池化模块一的输出与损失函数一计算模块连接。
4.根据权利要求1所述的一种高度自动化的票据分类方法,其特征在于:所述全卷积模块二(322)包括依次连接的卷积层四和平均池化层二,
所述卷积层四的输入与所述全局最大池化模块连接,所述平均池化层二的输出与损失函数二计算模块连接。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安网算数据科技有限公司,未经西安网算数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010399377.4/1.html,转载请声明来源钻瓜专利网。





