[发明专利]识别方法及装置在审
| 申请号: | 202010640068.1 | 申请日: | 2020-07-06 |
| 公开(公告)号: | CN111753802A | 公开(公告)日: | 2020-10-09 |
| 发明(设计)人: | 张炳旺;郭常圳 | 申请(专利权)人: | 北京猿力未来科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06F40/242;G06N3/04;G06N3/08 |
| 代理公司: | 北京智信禾专利代理有限公司 11637 | 代理人: | 刘晓楠 |
| 地址: | 100102 北京市朝阳区广顺南大*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 识别 方法 装置 | ||
本申请提供识别方法及装置,其中所述识别方法包括:获取待识别文字图像;将所述待识别文字图像输入至文字识别模型,经过所述文字识别模型中的特征提取层提取所述待识别文字图像的文字特征;根据所述文字特征生成中间特征向量,并通过所述文字识别模型中的全连接层对所述中间特征向量进行处理,获得多维特征向量;将所述多维特征向量输入至所述文字识别模型中的输出层进行向量转换,输出对所述待识别文字图像中文字的识别结果;本申请提供的识别方法,可以实现识别手写文字的同时检测手写文字的正确性,从而丰富更多的应用场景,并且可以有效提高识别效率和识别准确率。
技术领域
本申请涉及自然语言处理技术领域,特别涉及识别方法及装置。
背景技术
自然语言处理(Natural Language Processing,NLP)是计算机科学领域与人工智能领域中的一个重要方向,它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。
随着自然语言处理技术的发展,在越来越多的场景中所应用,比如语音识别、文字识别或错字判别场景等;然而,在对汉字进行错误判别的场景中,汉字书写错误的形式包含很多种,如偏旁部首组合错误、笔画笔顺错误、多笔画错误、少笔画错误、结构错误等,错字往往形似正确的字,不易区分,且错误形式多样,无法预估,难以归纳总结,因此亟需一种有效的方案以解决该问题。
发明内容
有鉴于此,本申请实施例提供了一种识别方法,以解决现有技术中存在的技术缺陷。本申请实施例同时提供了一种识别装置,一种计算设备,以及一种计算机可读存储介质。
根据本申请实施例的第一方面,提供了一种识别方法,包括:
获取待识别文字图像;
将所述待识别文字图像输入至文字识别模型,经过所述文字识别模型中的特征提取层提取所述待识别文字图像的文字特征;
根据所述文字特征生成中间特征向量,并通过所述文字识别模型中的全连接层对所述中间特征向量进行处理,获得多维特征向量;
将所述多维特征向量输入至所述文字识别模型中的输出层进行向量转换,输出对所述待识别文字图像中文字的识别结果。
可选的,所述根据所述文字特征生成中间特征向量,包括:
将所述文字特征输入至所述文字识别模型中的归一化层进行归一化处理,获得所述中间特征向量。
可选的,所述将所述多维特征向量输入至所述文字识别模型中的输出层进行向量转换,输出对所述待识别文字图像中文字的识别结果,包括:
将所述多维特征向量输入至所述文字识别模型中的文字识别模块,经过所述文字识别模块中的输出层对所述多维特征向量进行向量转换,获得所述待识别文字图像中文字的识别信息;
在所述识别信息中选择概率最高的编号确定为目标编号;
基于所述目标编号查询预设的文字字典,根据查询结果确定目标文字;
将所述目标文字确定为对所述待识别文字图像中文字的识别结果并输出。
可选的,所述将所述多维特征向量输入至所述文字识别模型中的输出层进行向量转换,输出对所述待识别文字图像中文字的识别结果步骤执行之前,还包括:
将所述多维特征向量输入至所述文字识别模型中的错字判别模块进行文字判别处理,获得二维特征向量;
相应的,所述将所述多维特征向量输入至所述文字识别模型中的输出层进行向量转换,输出对所述待识别文字图像中文字的识别结果,包括:
将所述二维特征向量输入至所述输出层进行向量转换,输出对所述待识别文字图像中文字的错字识别结果,作为所述识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京猿力未来科技有限公司,未经北京猿力未来科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010640068.1/2.html,转载请声明来源钻瓜专利网。





