[发明专利]一种英文字符的录入方法和录入系统在审
| 申请号: | 202110965136.6 | 申请日: | 2021-08-23 |
| 公开(公告)号: | CN113420734A | 公开(公告)日: | 2021-09-21 |
| 发明(设计)人: | 朱婷 | 申请(专利权)人: | 东华理工大学南昌校区 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06N3/04 |
| 代理公司: | 南昌明佳知识产权代理事务所(普通合伙) 36132 | 代理人: | 苏彦江 |
| 地址: | 330000 江西省南*** | 国省代码: | 江西;36 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 英文 字符 录入 方法 系统 | ||
本发明公开了一种英文字符的录入方法和录入系统。该录入方法包括:获取二值化图像;预处理所述二值化图像获得目标图像;分割目标图像获得多个独立的图像块;合并图像块获得字符串图像;将字符串图像输入到英文识别网络获得英文字符串;在词汇库中检索该英文字符串,根据可检索比例不同的处理。最终获得识别效率较高的目标英文文本。本发明能够实现对待识别英文文本图像中的英文字符的快速识别录入,识别精确度更高。
技术领域
本发明涉及文本处理技术,尤其涉及一种英文字符的录入方法和录入系统。
背景技术
随着智能化信息时代的到来,计算机对于输入手写字符尤其是英文字符的识别录入需求越来越大,目前基于深度学习的文本处理技术逐渐成为研究主流,中国古文字识别也大范围采用深度学习。参照CN201810355457.2,该文献采用一种基于深度卷积神经网络算法的文字识别方法。在英文识别中,因26个字母手写“变体”特征复杂(变体包括:多种不同的随机重塑、扭曲、印刷颜色黑体或白体的改变),这导致其他文字字符的录入方法并不完全适用于“变体”复杂的英文字符。在使用单一的深度卷积神经网络算法进行英文字符识别时,字符特征提取时较为困难。
发明内容
本发明提供一种英文字符的录入方法和录入系统,以解决现有技术中使用单一深度卷积神经网络算法进行英文字符识别时,容易导致字符特征提取出错的问题。
一种英文字符的录入方法,其特征在于,包括以下步骤:
步骤1,获取包含英文字符的二值化图像;
步骤2,预处理所述二值化图像获得目标图像I(x,y),x与y分别为目标图像像素点的横坐标和纵坐标;
步骤3,依次采用横向像素查找法和纵向像素查找法分割目标图像I(x,y),获得多个独立的图像块Pnm(x,y),n与m分别是图像块的横向和纵向序号;
步骤4,合并横向间距小于基准间距△的图像块Pnm(x,y),获得字符串图像;
步骤5,将所述字符串图像输入到英文识别网络获得英文字符串;
步骤6,在词汇库中检索该英文字符串,若英文字符串的可检索比例r大于基准识别率R,则进入步骤8,否则进入步骤7;
步骤7,调整基准间距△,返回步骤4;
步骤8,组合多个英文字符串获得目标英文文本。
在本发明中,步骤2的预处理包括Hough算法矫正以及线性归一化,获得目标图像。
在本发明中,步骤3的横向像素查找法是指目标图像I(x,y)查找多个横向间隔坐标,该多个横向间隔坐标满足:纵坐标相同且横坐标取任意值时,像素值均为0,采用该横向间隔坐标分割目标图像I(x,y)获得图像块Pn(x,y);纵向像素查找法是指将图像块Pn(x,y)查找多个纵向间隔坐标,该多个纵向间隔坐标满足:横坐标相同且纵坐标取任意值时,像素值均为0,采用该纵向间隔坐标分割图像块Pn(x,y)获得图像块Pnm(x,y)。
在本发明中,在步骤4中:若min(xnm+1)-max(xnm)<△,合并图像块Pnm(x,y)与图像块Pnm+1(x,y),min(xnm+1)为图像块Pnm+1(x,y)的最小横坐标,max(xnm)为图像块Pnm(x,y)的最大横坐标。
在本发明中,英文识别网络包括RestNet网络层、Bi-LSTM网络层、全连接层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华理工大学南昌校区,未经东华理工大学南昌校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110965136.6/2.html,转载请声明来源钻瓜专利网。





