[发明专利]一种文本识别的方法、装置、设备以及存储介质在审
申请号: | 202110310267.0 | 申请日: | 2021-03-23 |
公开(公告)号: | CN112990035A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 陈禹燊;韩光耀;姜泽青 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06F40/216;G06F40/242;G06F40/30 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 王一;包莉莉 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 识别 方法 装置 设备 以及 存储 介质 | ||
本公开提供了一种文本识别的方法、装置、设备以及存储介质,涉及图像识别、自然语言处理、深度学习、云计算等人工智能领域。具体实现方案为:获取待识别对象的机器识别结果;基于机器识别结果和待识别对象的语义特征,通过置信度生成模型,得到机器识别结果的置信度;对机器识别结果的置信度和置信度阈值进行比较,确定待识别对象的最终识别结果,其中,置信度阈值为预先根据置信度生成模型所确定的。根据本公开的技术,可以减少文本审核过程中人工审核的工作量,并且提高识别效率。
技术领域
本公开涉及计算机技术领域,尤其涉及图像识别、自然语言处理、深度学习、云计算等人工智能领域。
背景技术
在文本识别技术中,针对票据审核场景下,可以实现对票据的识别,进而对票据的用途等信息进行分类。相关技术中通常采用OCR(Optical Character Recognition,光学字符识别)和NLP(Natural Language Processing,自然语言处理)相结合的方式对票据进行机器识别,但由于机器识别结果存在误差,因此还需审核人员对全部的机器识别结果进行人工审核,存在人力成本高、识别效率低等缺陷。
发明内容
本公开提供了一种文本识别的方法、装置、设备以及存储介质。
根据本公开的一方面,提供了一种文本识别的方法,包括:
获取待识别对象的机器识别结果;
基于机器识别结果和待识别对象的语义特征,通过置信度生成模型,得到机器识别结果的置信度;
对机器识别结果的置信度和置信度阈值进行比较,确定待识别对象的最终识别结果,其中,置信度阈值为预先根据置信度生成模型所确定的。
根据本公开的另一方面,提供了一种置信度生成模型的训练方法,包括:
利用待识别对象的机器识别结果样本,确定初始化的目标置信度;
将待识别对象的机器识别结果样本和机器识别结果样本的语义特征输入待训练的置信度生成模型,得到预测置信度和目标置信度的差异;
根据差异对待训练的置信度生成模型进行训练,直至差异在允许范围内。
根据本公开的另一方面,提供了一种文本识别的装置,包括:
机器识别结果获取模块,用于获取待识别对象的机器识别结果;
置信度生成模块,用于基于机器识别结果和待识别对象的语义特征,通过置信度生成模型,得到机器识别结果的置信度;
最终识别结果确定模块,用于对机器识别结果的置信度和置信度阈值进行比较,确定待识别对象的最终识别结果,其中,置信度阈值为预先根据置信度生成模型所确定的。
根据本公开的另一方面,提供了一种置信度生成模型的训练装置,包括:
目标置信度确定模块,用于利用待识别对象的机器识别结果样本,确定初始化的目标置信度;
差异生成模块,用于将待识别对象的机器识别结果样本和机器识别结果样本的语义特征输入待训练的置信度生成模型,得到预测置信度和目标置信度的差异;
训练模块,用于根据差异对待训练的置信度生成模型进行训练,直至差异在允许范围内。
根据本公开的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开任一实施例中的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110310267.0/2.html,转载请声明来源钻瓜专利网。