[发明专利]一种字符识别方法、装置、设备及介质在审
申请号: | 202210114334.6 | 申请日: | 2022-01-30 |
公开(公告)号: | CN114445812A | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 毛晓飞;黄灿 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/148;G06V10/774;G06K9/62 |
代理公司: | 北京信远达知识产权代理有限公司 11304 | 代理人: | 贾小慧 |
地址: | 101299 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字符 识别 方法 装置 设备 介质 | ||
1.一种字符识别方法,其特征在于,所述方法包括:
获取待处理的文本图像,所述待处理的文本图像包括待识别文本信息;
将所述待处理的文本图像输入字符识别网络模型中,获得输出结果,所述输出结果包括所述待识别文本信息;
其中,所述字符识别网络模型是利用训练样本训练生成的,所述训练样本包括第一样本图像以及所述第一样本图像所对应的多个子样本图像,所述多个子样本图像中每个子样本图像的高度与所述第一样本图像的高度相同,所述多个子样本图像中每个子样本图像的宽度相同,且所述每个子样本图像的宽度小于所述第一样本图像的宽度,所述第一样本图像包括文本信息。
2.根据权利要求1所述的方法,其特征在于,所述字符识别网络模型的训练过程包括:
将所述第一样本图像、所述多个子样本图像分别输入初始网络模型,获取第一特征向量集、第二特征向量集,所述第一特征向量集的维数与所述第二特征向量集的维数相同,所述第一特征向量集中的特征向量和所述第二特征向量集中的特征向量为所述文本信息的特征向量;
根据所述第一特征向量集和所述第二特征向量集确定第一损失量,并基于所述第一损失量对所述初始网络模型的参数进行调整,重新执行将所述第一样本图像、所述多个子样本图像分别输入初始网络模型以及后续训练过程,直至第一损失量小于第一阈值,获得所述字符识别网络模型。
3.根据权利要求2所述的方法,其特征在于,所述多个子样本图像的获取过程包括:
确定划分参数,并利用所述划分参数对所述第一样本图像进行多次划分,获得所述多个子样本图像,所述多个子样本图像中每个子样本图像的宽度与所述样本图像的宽度的比值等于所述划分参数,所述划分参数大于0且小于1。
4.根据权利要求3所述的方法,其特征在于,所述利用所述划分参数对所述样本图像进行多次划分,获得所述多个子样本图像,包括:
针对每次划分操作,在所述第一样本图像中确定划分的起始位置;
根据所述起始位置以及所述划分参数对所述第一样本图像进行划分,获得所述多个子样本图像。
5.根据权利要求3或4所述的方法,其特征在于,所述划分参数的取值范围位于75%-95%。
6.根据权利要求2所述的方法,其特征在于,所述方法还包括:
获取第二样本图像以及所述第二样本图像对应的标注,所述第二样本图像包括文本信息,所述标注用于反映所述文本信息;
将所述第二样本图像输入所述字符识别网络模型中,获得识别结果,所述识别结果包括所述文本信息;
基于所述识别结果以及所述第二样本图像的标注确定第二损失量,并基于所述第二损失量对所述字符识别网络模型的参数进行调整,重新执行将所述第二样本图像输入字符识别网络模型以及后续训练过程,直至第二损失量小于第二阈值。
7.根据权利要求2所述的方法,其特征在于,所述将所述第一样本图像输入初始网络模型,获取第一特征向量集,包括:
对所述第一样本图像进行数据增强处理,获得处理后的第一样本图像;
将所述处理后的第一样本图像输入所述初始网络模型,获取所述第一特征向量集。
8.根据权利要求2所述的方法,其特征在于,所述根据所述第一特征向量集和所述第二特征向量集确定第一损失量,包括:
利用对比损失函数计算所述第一特征向量集与所述第二特征向量集之间的第一损失量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210114334.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种车辆的路径规划方法、装置、设备及介质
- 下一篇:波束赋形训练方法及装置