[发明专利]一种上下标字符识别的方法有效
申请号: | 202110246338.5 | 申请日: | 2021-03-05 |
公开(公告)号: | CN112906693B | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 杨红飞;韩瑞峰 | 申请(专利权)人: | 杭州费尔斯通科技有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V30/10;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 刘静 |
地址: | 310051 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 下标 字符 识别 方法 | ||
1.一种上下标字符识别的方法,其特征在于,包括如下步骤:
(1)训练数据的产生
获取字体文件,用字体文件产生标注样本作为训练数据;具体为:随机选取一种字体及字体尺寸,在一张空白图像上用选取的字体写字,所写的字从包含使用场景中的全部字符集中随机选取,图像为能容纳一行字符的长条形,其宽度为固定大小,长度为随机;图像的标签即从字符集中随机选取的一行字符,对于每个字符,分别定义其上标和下标类别;
(2)序列标注模型的定义和训练
采用CRNN模型作为序列标注模型,CRNN模型的输入为随机选择的包含上下标的一行字符的图片,输出针对每个字符包含了字符、上标和下标类别3个输出值;将样本的标签按照在整个字符集中的序号进行数字化表示;得到每个样本的标签后,用步骤(1)随机产生样本的方式,产生每批样本,对CRNN模型进行训练;
(3)用真实样本对模型调整
选取一部分真实场景的图像进行标注,标签格式与步骤(1)生成样本一致;对步骤(2)训练好的模型在真实样本上继续训练进而调整优化模型;
(4)上下标字符识别
用步骤(3)调整优化后的模型对包含上下标的一行字符的图片进行识别,并对其中识别出的上下标字符进行对应的转义,并在能展示富文本的文件中写成上下标。
2.根据权利要求1所述的一种上下标字符识别的方法,其特征在于,步骤(1)中上标字符在图片中的底线为正常字符高度的上1/2到上1/3,下标字符在图片中的顶部位置为正常字符高度的下1/2到下1/3。
3.根据权利要求1所述的一种上下标字符识别的方法,其特征在于,将样本的标签按照在整个字符集中的序号进行数字化表示时,对上下标进行转义处理,空格定义为第0个字符;空格字符算一个字符,即对应位置上没有任何字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州费尔斯通科技有限公司,未经杭州费尔斯通科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110246338.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种野外便携式集蚤器
- 下一篇:一种肛肠科护理用清洗装置