[发明专利]基于手写字体识别的方法及识别系统在审
| 申请号: | 202310658892.3 | 申请日: | 2023-06-06 |
| 公开(公告)号: | CN116416628A | 公开(公告)日: | 2023-07-11 |
| 发明(设计)人: | 徐丹;白世亮 | 申请(专利权)人: | 广州宏途数字科技有限公司 |
| 主分类号: | G06V30/19 | 分类号: | G06V30/19;G06V10/10;G06V10/32;G06V30/18;G06V10/764;G06V10/82;G06N3/0464;G06N3/08;G06T3/00 |
| 代理公司: | 广州君咨知识产权代理有限公司 44437 | 代理人: | 李平 |
| 地址: | 510000 广东省广州市*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 手写 字体 识别 方法 系统 | ||
本发明涉及文字识别技术领域,具体涉及一种基于手写字体识别的方法及识别系统,包括,步骤S1,文字采集模块采集不同的手写字体图像;步骤S2,数据准备模块将所述目标图像和所述风格图像输送至数据预处理模块;步骤S3,数据预处理模块将各所述转换后图像和各所述掩码图输送至模型训练模块;步骤S4,所述模型训练模块在接收到各所述转换后图像和各所述掩码图时进行图像迁移融合处理以得到最优参数模型并将最优参数模型;步骤S5,批量生成数据模块进行批量数据生成处理以生成风格迁移后的目标图像数据,完成手写字体识别。克服现有技术中在对离线手写字体识别时无法对文字图像进行风格迁移处理时保留目标图像颜色导致针对文字识别精度低。
技术领域
本发明设计文字识别技术领域,具体涉及一种基于手写字体识别的方法及识别系统。
背景技术
手写字体识别可分为在线识别和离线识别,在线字体识别是指在通过触摸屏等输入设备手写字体过程中,计算机根据书写字体的笔画走向、笔画顺序、书写速度等多种信息进行识别,由于信息量多且具有连续性,因此识别难度较小,识别准确率也较高。离线字体识别提供的信息量少,仅仅通过识别一个字体的二维图像来提取字体特征,所以识别难度较大,识别准确率也较低。
目前,基于深度学习的计算机视觉技术不断发展,大量研究采用基于深度学习的方法来识别手写文字,但是,深度学习算法需要大量手写文字数据训练网络。数据集图像的数量和数据集的针对性往往决定了检测网络的准确度和泛化能力。但是,由于图像识别文字的情况千变万化,对于图像的清晰度,图像内文字的风格、颜色、部分缺失等情况。
图像风格迁移技术,就是通过将风格图像和目标图像中的风格和内容进行分离,将风格图像中的风格与目标图像的内容进行重新组合,从而生成一张具有风格图像风格的目标图像。现有的风格迁移网络主要分为两个部分,一是基于卷积神经网络的风格迁移,核心运用到VGG19网络;二是基于对抗神经网络的风格迁移。前者具有迁移稳定,效果好的优点,迁移速度慢的缺点,后者具有迁移速度快的优点,缺点是无法处理图像形状发生改变的情况。
基于上述,提出一种基于手写字体识别的方法及识别系统。
发明内容
为此,本发明提供一种基于手写字体识别的方法及识别系统,用以克服现有技术中在对离线手写字体识别时无法对文字图像进行风格迁移处理时保留目标图像颜色导致针对文字识别精度低的问题。
一方面,本发明提供一种基于手写字体识别的方法,包括:
步骤S1,文字采集模块采集不同的手写字体图像并输送至数据准备模块;
步骤S2,所述数据准备模块将用以迁移风格的手写字体图像记为目标图像,数据准备模块选取字体库图像,将其记为风格图像并将该风格图像的风格作为目标图像风格迁移后的风格标准;所述数据准备模块将所述目标图像和所述风格图像输送至数据预处理模块;
步骤S3,所述数据预处理模块对所述风格图像进行裁切处理以使风格图像的尺寸与所述目标图像尺寸相同,数据预处理模块在完成对风格图像的裁切后依次制作针对风格图像和目标图像的掩码图并对各图像进行颜色格式转换处理;所述数据预处理模块将各转换后图像和各所述掩码图输送至模型训练模块;
步骤S4,所述模型训练模块在接收到各所述转换后图像和各所述掩码图时进行图像迁移融合处理以得到最优参数模型并将最优参数模型输送至批量生成数据模块;
步骤S5,所述批量生成数据模块在接收到所述最优参数模型后进行批量数据生成处理以生成风格迁移后的目标图像数据,完成手写字体识别。
进一步地,在所述步骤S3中,所述数据预处理模块对所述风格图像和所述目标图像的预处理过程包括:
步骤S31,所述数据预处理模块采用Opencv+Python程序对所述风格图像进行随机裁剪以使裁剪后的风格图像的尺寸与所述目标图像的尺寸相同;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州宏途数字科技有限公司,未经广州宏途数字科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310658892.3/2.html,转载请声明来源钻瓜专利网。





