[发明专利]一种英文字符的录入方法和录入系统在审
| 申请号: | 202110965136.6 | 申请日: | 2021-08-23 |
| 公开(公告)号: | CN113420734A | 公开(公告)日: | 2021-09-21 |
| 发明(设计)人: | 朱婷 | 申请(专利权)人: | 东华理工大学南昌校区 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06N3/04 |
| 代理公司: | 南昌明佳知识产权代理事务所(普通合伙) 36132 | 代理人: | 苏彦江 |
| 地址: | 330000 江西省南*** | 国省代码: | 江西;36 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 英文 字符 录入 方法 系统 | ||
1.一种英文字符的录入方法,其特征在于,包括以下步骤:
步骤1,获取包含英文字符的二值化图像;
步骤2,预处理所述二值化图像获得目标图像I(x,y),x与y分别为目标图像像素点的横坐标和纵坐标;
步骤3,依次采用横向像素查找法和纵向像素查找法分割目标图像I(x,y),获得多个独立的图像块Pnm(x,y),n与m分别是图像块的横向和纵向序号;
步骤4,合并横向间距小于基准间距△的图像块Pnm(x,y),获得字符串图像;
步骤5,将所述字符串图像输入到英文识别网络获得英文字符串;
步骤6,在词汇库中检索该英文字符串,若英文字符串的可检索比例r大于基准识别率R,则进入步骤8,否则进入步骤7;
步骤7,调整基准间距△,返回步骤4;
步骤8,组合多个英文字符串获得目标英文文本。
2.根据权利要求1所述的英文字符的录入方法,其特征在于,步骤2的预处理包括Hough算法矫正以及线性归一化,获得目标图像。
3.根据权利要求1所述的英文字符的录入方法,其特征在于,步骤3的横向像素查找法是指目标图像I(x,y)查找多个横向间隔坐标,该多个横向间隔坐标满足:纵坐标相同且横坐标取任意值时,像素值均为0,采用该横向间隔坐标分割目标图像I(x,y)获得图像块Pn(x,y);纵向像素查找法是指将图像块Pn(x,y)查找多个纵向间隔坐标,该多个纵向间隔坐标满足:横坐标相同且纵坐标取任意值时,像素值均为0,采用该纵向间隔坐标分割图像块Pn(x,y)获得图像块Pnm(x,y)。
4.根据权利要求1所述的英文字符的录入方法,其特征在于,在步骤4中:若min(xnm+1)-max(xnm)<△,合并图像块Pnm(x,y)与图像块Pnm+1(x,y),min(xnm+1)为图像块Pnm+1(x,y)的最小横坐标,max(xnm)为图像块Pnm(x,y)的最大横坐标。
5.根据权利要求1所述的英文字符的录入方法,其特征在于,英文识别网络包括RestNet网络层、Bi-LSTM网络层、全连接层。
6.根据权利要求5所述的英文字符的录入方法,其特征在于,在RestNet网络层引入SE模块,SE模块包括压缩模块和激励模块,所述压缩模块通过全局平均池化将输入图像压缩为1×1×C的特征向量再与输入图像相乘得到特征图,激励模块对特征图进行激励,得到激励后的特征图,再通过通道权重与激励后的特征图相乘获得RestNet网络层的识别结果,其中C为输入图像的通道数。
7.根据权利要求5所述的英文字符的录入方法,其特征在于,所述Bi-LSTM网络层中引入损失函数,所述的损失函数为:,L为损失函数的值,c为英文字符串的长度,gi和yi分别为长度为i的英文字符串在英文识别网络的样本真实值和英文识别网络模型的真实值。
8.根据权利要求1所述的英文字符的录入方法,其特征在于,可检索比例r=t/T,t为英文字符串的可检索数量,T为字符串图像的数量。
9.一种英文字符的录入系统,其特征在于,具有存储器、处理器以及存储在存储器中并可在处理器上运行的计算机可读指令,所述处理器执行所述计算机可读指令时实现所述权利要求1所述的英文字符的录入方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华理工大学南昌校区,未经东华理工大学南昌校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110965136.6/1.html,转载请声明来源钻瓜专利网。





