[发明专利]基于图片的字体识别方法、装置、电子设备及存储介质在审
| 申请号: | 201910563421.8 | 申请日: | 2019-06-26 |
| 公开(公告)号: | CN110276418A | 公开(公告)日: | 2019-09-24 |
| 发明(设计)人: | 张水发;李岩 | 申请(专利权)人: | 北京达佳互联信息技术有限公司 |
| 主分类号: | G06K9/68 | 分类号: | G06K9/68;G06K9/32;G06N3/04 |
| 代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 丁芸;马敬 |
| 地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 模糊图片 字体识别 分辨率 图片 字体 存储介质 电子设备 准确率 卷积神经网络 低分辨率 关键信息 特征提取 特征信息 网络获取 解析 捕捉 网络 学习 | ||
本公开关于一种基于图片的字体识别方法、装置、电子设备及存储介质,通过将待处理图片进行处理,分别得到两种不同分辨率的图片,将两种不同分辨率的图片分别输入两个独立的卷积神经网络进行特征提取,可以同等对待不同分辨率的图片,使网络对较低分辨率的图片也有很好的解析力,提高了模糊图片中对字体的识别效果,最终提高了模糊图片的识别准确率,利用预先训练的深度学习网络获取图片中字体的特征信息,捕捉到模糊图片中的字体局部关键信息,提高模糊图片中字体识别的准确率。
技术领域
本公开涉及文字识别技术领域,尤其涉及基于图片的字体识别方法、装置、电子设备及存储介质。
背景技术
随着图文能够提供给用户更多精彩的信息,如何从图文中识别出字体以便于提升用户体验已成为当前研究的热点。目前,现有的文字识别技术为通过提取文字图片的特征,输入递归神经网络,解析得到字体识别结果,此方法对于清晰的文字图片识别结果较好,但是对于模糊的文字图片,由于汉字有一万多个,很多字形相近,图片模糊后文字特征不明显,导致识别结果较差,使得字体识别的准确率较低。
发明内容
本公开提供一种基于图片的字体识别方法、装置、电子设备、存储介质及包含指令的计算机程序产品,以实现解决模糊图片中的字体识别,提高模糊图片中字体识别的准确率。
本公开的技术方案如下:
根据本公开实施例的第一方面,本公开提供一种基于图片的字体识别方法,包括:
获取待处理图片,得到所述待处理图片的宽度和高度;
对所述待处理图片进行缩放处理,分别得到第一图片和第二图片,其中所述第二图片的分辨率低于所述第一图片的分辨率;
将所述第一图片输入预先训练的第一卷积神经网络进行下采样,得到第一图片的特征图,将所述第二图片输入预先训练的第二卷积神经网络进行下采样,得到第二图片的特征图;
将所述第二图片的特征图输入到反卷积层进行上采样,得到第二图片上采样后的特征图;
将所述第一图片的特征图和所述第二图片上采样后的特征图进行连接,得到目标特征图;
将所述目标特征图输入到预先训练的深度学习网络模型中,识别所述待处理图片中的字体。
可选的,所述预先训练好的第一卷积神经网络对所述第一图片的下采样倍数和所述预先训练好的第二卷积神经网络对所述第二图片的下采样倍数相同。
可选的,所述预先训练的深度学习网络为双向长短期记忆神经网络BI-LSTM模型。
可选的,所述预先训练的第一卷积神经网络、预先训练的第二卷积神经网络和预先训练的双向长短期记忆神经网络BI-LSTM模型的训练步骤,包括:
获取样本图片,标定所述样本图像中的文字,其中,所述样本图片为模糊文字图片;
获取第一卷积神经网络、第二卷积神经网络及BI-LSTM网络组成的级联模型;
将所述样本图片进行缩放处理,得到第一样本图片和第二样本图片,其中所述第二样本图片的分辨率低于所述第一样本图片的分辨率;
将所述第一样本图片和所述第二样本图片分别输入到第一卷积神经网络和第二卷积神经网络,分别对所述训练样本中的模糊文字图片进行特征提取,分别得到第一样本图片的特征图和第二样本图片的特征图,预先训练的第一卷积神经网络和预先训练的第二卷积神经网络;
将所述第二样本图片的特征图输入到反卷积层进行上采样,得到第二样本图片上采样后的特征图;
将所述第一样本图片的特征图和所述第二样本图片上采样后的特征图进行连接,得到目标样本特征图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京达佳互联信息技术有限公司,未经北京达佳互联信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910563421.8/2.html,转载请声明来源钻瓜专利网。





