[发明专利]识别方法及装置在审

申请号：	202010640068.1	申请日：	2020-07-06
公开（公告）号：	CN111753802A	公开（公告）日：	2020-10-09
发明（设计）人：	张炳旺;郭常圳	申请（专利权）人：	北京猿力未来科技有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/46;G06F40/242;G06N3/04;G06N3/08
代理公司：	北京智信禾专利代理有限公司 11637	代理人：	刘晓楠
地址：	100102 北京市朝阳区广顺南大***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	识别方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供识别方法及装置，其中所述识别方法包括：获取待识别文字图像；将所述待识别文字图像输入至文字识别模型，经过所述文字识别模型中的特征提取层提取所述待识别文字图像的文字特征；根据所述文字特征生成中间特征向量，并通过所述文字识别模型中的全连接层对所述中间特征向量进行处理，获得多维特征向量；将所述多维特征向量输入至所述文字识别模型中的输出层进行向量转换，输出对所述待识别文字图像中文字的识别结果；本申请提供的识别方法，可以实现识别手写文字的同时检测手写文字的正确性，从而丰富更多的应用场景，并且可以有效提高识别效率和识别准确率。

技术领域

本申请涉及自然语言处理技术领域，特别涉及识别方法及装置。

背景技术

自然语言处理(Natural Language Processing，NLP)是计算机科学领域与人工智能领域中的一个重要方向，它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。

随着自然语言处理技术的发展，在越来越多的场景中所应用，比如语音识别、文字识别或错字判别场景等；然而，在对汉字进行错误判别的场景中，汉字书写错误的形式包含很多种，如偏旁部首组合错误、笔画笔顺错误、多笔画错误、少笔画错误、结构错误等，错字往往形似正确的字，不易区分，且错误形式多样，无法预估，难以归纳总结，因此亟需一种有效的方案以解决该问题。

发明内容

有鉴于此，本申请实施例提供了一种识别方法，以解决现有技术中存在的技术缺陷。本申请实施例同时提供了一种识别装置，一种计算设备，以及一种计算机可读存储介质。

根据本申请实施例的第一方面，提供了一种识别方法，包括：

获取待识别文字图像；

将所述待识别文字图像输入至文字识别模型，经过所述文字识别模型中的特征提取层提取所述待识别文字图像的文字特征；

根据所述文字特征生成中间特征向量，并通过所述文字识别模型中的全连接层对所述中间特征向量进行处理，获得多维特征向量；

将所述多维特征向量输入至所述文字识别模型中的输出层进行向量转换，输出对所述待识别文字图像中文字的识别结果。

可选的，所述根据所述文字特征生成中间特征向量，包括：

将所述文字特征输入至所述文字识别模型中的归一化层进行归一化处理，获得所述中间特征向量。

可选的，所述将所述多维特征向量输入至所述文字识别模型中的输出层进行向量转换，输出对所述待识别文字图像中文字的识别结果，包括：

将所述多维特征向量输入至所述文字识别模型中的文字识别模块，经过所述文字识别模块中的输出层对所述多维特征向量进行向量转换，获得所述待识别文字图像中文字的识别信息；

在所述识别信息中选择概率最高的编号确定为目标编号；