[发明专利]一种基于CRNN算法的发票文件真伪识别方法在审
| 申请号: | 202010058430.4 | 申请日: | 2020-01-19 | 
| 公开(公告)号: | CN111223230A | 公开(公告)日: | 2020-06-02 | 
| 发明(设计)人: | 薛洛良;彭飞;李燕;张高言;丁萌萌;任定一;韩沛;魏薇;张茜茜;张亮;杨静;刘颜乐;王梦 | 申请(专利权)人: | 河南电力物资有限公司 | 
| 主分类号: | G07D7/20 | 分类号: | G07D7/20;G06K9/34 | 
| 代理公司: | 郑州联科专利事务所(普通合伙) 41104 | 代理人: | 常娟 | 
| 地址: | 450000 *** | 国省代码: | 河南;41 | 
| 权利要求书: | 查看更多 | 说明书: | 查看更多 | 
| 摘要: | |||
| 搜索关键词: | 一种 基于 crnn 算法 发票 文件 真伪 识别 方法 | ||
1.一种基于CRNN算法的发票文件真伪识别方法,其特征在于:包括以下步骤:
A、采集发票文件中二维码位置信息;
B、识别发票文件的票面信息和真实票据信息;具体包括:
提取具有相同二维码位置信息的发票文件图像中的图像块,每个图像块对应票面一项发票单项信息,采用CRNN算法提取图像块对应的发票单项信息并构成发票文件的票面信息;
识别发票文件中的二维码,通过联网全国增值税发票查验平台获取发票文件的真实电子文本信息,即发票文件的真实票据信息;
C、分别提取票面信息中的N项票面关键项信息和真实票据信息中的N项真实关键项信息,票面关键项信息与真实关键项信息一一对应;
D、将票面关键项信息的字符长度与对应真实关键项信息的字符长度一一进行比对;若N项票面关键项信息的字符长度与N项真实关键项信息的字符长度均一致,则进入步骤E;反之,则进入步骤F;
E、发票文件为真,将发票文件的真实票据信息录入本地发票数据库;
F、发票文件存疑,由人工复核发票文件真伪。
2.根据权利要求1所述的基于CRNN算法的发票文件真伪识别方法,其特征在于:步骤B中,若识别发票文件图像中的二维码后通过联网全国增值税发票查验平台无法获取发票文件的真实电子文本信息,则直接进入步骤F。
3.根据权利要求2所述的基于CRNN算法的发票文件真伪识别方法,其特征在于:所述票面关键项信息包括票面信息中的购买方名称、货物或应税劳务、服务名称、单价及金额共四项单项信息;所述真实关键项信息包括真是票据信息中的购买方名称、货物或应税劳务、服务名称、单价及金额共四项单项信息。
4.根据权利要求2所述的基于CRNN算法的发票文件真伪识别方法,其特征在于:步骤B中采用CRNN算法提取图像块对应的发票单项信息的过程具体包括:
b1:对发票文件图像进行区域图像分割,获取包含发票单项信息的分割图像块;每个图像块均对应一项发票单项信息;
b2:将分割图像块输入CRNN网络的卷积层,由CRNN网络卷积层对分割图像块中的数值进行特征提取;
b3:利用CRNN网络的映射层将在卷积层提取到的特征信息表示为特征向量,获取特征序列;
b4:CRNN网络循环层对步骤b3输出的特征序列进行预测,得到每帧特征的概率分布;
b5:特征序列解码,获取分割图像块对应发票单项信息中不定长数据的识别结果;
b6:通过字符串长度计算函数计算发票单项信息识别结果的数值长度。
5.根据权利要求1所述的基于CRNN算法的发票文件真伪识别方法,其特征在于:所述发票文件包括发票原件、发票图片、发票扫描件或发票复印件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南电力物资有限公司,未经河南电力物资有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010058430.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种多元素定性定量配肥装置及方法
- 下一篇:功率控制装置及方法、存储介质





