[发明专利]票据自动识别方法、装置、计算机设备及存储介质在审

专利信息
申请号: 202111015585.0 申请日: 2021-08-31
公开(公告)号: CN113569998A 公开(公告)日: 2021-10-29
发明(设计)人: 刘舒萍 申请(专利权)人: 平安医疗健康管理股份有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06K9/46;G06K9/34;G06N3/04;G06N3/08
代理公司: 深圳市世联合知识产权代理有限公司 44385 代理人: 汪琳琳
地址: 200001 上海市黄浦*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 票据 自动识别 方法 装置 计算机 设备 存储 介质
【说明书】:

本申请实施例属于人工智能和数字医疗领域,应用于智慧医疗领域中,涉及一种票据自动识别方法,包括将训练数据集输入至构建的BERT网络模型中,得到表层特征、句法特征和语义特征进行拼接,得到拼接特征,基于拼接特征输出BERT网络模型的预测结果,根据预测结果计算第一损失函数,根据第一损失函数对BERT网络模型进行迭代更新,输出BERT网络模型作为票据识别模型,对待识别票据进行光学字符识别,得到文本数据,将文本数据输入至票据识别模型,输出分类结果,并确定文本数据的字段类型。本申请还提供一种票据自动识别装置、计算机设备及存储介质。此外,本申请还涉及区块链技术,待识别票据可存储于区块链中。本申请可以自动识别出文本数据对应的字段类别。

技术领域

本申请涉及人工智能技术领域和数字医疗技术领域,尤其涉及一种票据自动识别方法、装置、计算机设备及存储介质。

背景技术

随着国家大力推进基本医疗全国联网和异地就医结算系统建设,使手工报销比例在逐年降低,但本地和异地零星报销长期存在。使用人工报销,成本高,易出错,而且在报销高峰期还存在报销压力大,医保三目录对码困难的问题。

对此,引入智能票据识别技术识别纸质发票。目前智能票据识别技术主要采用OCR技术,虽然OCR技术已经可以检测到医疗发票,医疗住院清单的文字,且高精度识别检测框里面的文字内容,但是针对不同版式的医疗票据,还需要人工做后处理,才能对接医保局系统,进行医保报销等操作,依然存在过程繁琐、工作量大以及效率低下等问题

发明内容

本申请实施例的目的在于提出一种票据自动识别方法、装置、计算机设备及存储介质,以解决相关技术中票据识别适用性低,进而造成部分后续操作过程繁琐、效率低下的技术问题。

为了解决上述技术问题,本申请实施例提供一种票据自动识别方法,采用了如下所述的技术方案:

获取原始票据数据集,预处理所述原始票据数据集获得训练数据集;

将所述训练数据集输入至构建的BERT网络模型中,得到表层特征、句法特征和语义特征;

将所述表层特征、所述句法特征以及所述语义特征进行拼接,得到拼接特征;

基于所述拼接特征输出所述BERT网络模型的预测结果;

根据所述预测结果计算第一损失函数,根据所述第一损失函数对所述BERT网络模型进行迭代更新,并确定迭代更新后的所述BERT网络模型是否收敛,当迭代更新后的所述BERT网络模型收敛,输出所述BERT网络模型作为票据识别模型;

获取待识别票据,对所述待识别票据进行光学字符识别,得到与所述待识别票据对应的文本数据;

将所述文本数据输入至票据识别模型,输出分类结果,并根据所述分类结果得到所述文本数据的字段类型。

进一步的,所述将所述训练数据集输入至构建的BERT网络模型中,得到表层特征、句法特征和语义特征包括:

将所述训练数据集输入至所述BERT网络模型的输入层进行向量转换,得到与所述训练数据集对应的特征向量数据;

通过所述BERT网络模型的特征提取层对所述特征向量数据进行特征提取,获得所述表层特征、所述句法特征和所述语义特征。

进一步的,所述特征提取层包括底层网络、中间层网络和高层网络,所述通过所述BERT网络模型的特征提取层对所述特征向量数据进行特征提取,获得所述表层特征、所述句法特征和所述语义特征包括:

通过所述底层网络从所述文本特征向量中提取表层特征,并将表层特征分别输入至所述中间层网络和所述高层网络;

通过所述中间层网络对所述表层特征进行特征提取,获得所述句法特征,并将所述句法特征输入至所述高层网络;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安医疗健康管理股份有限公司,未经平安医疗健康管理股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111015585.0/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top