[发明专利]一种易混字符二次识别方法有效
申请号: | 202010184590.3 | 申请日: | 2020-03-17 |
公开(公告)号: | CN111340033B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 付鹏斌;彭荆旋;杨惠荣 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06V30/19 | 分类号: | G06V30/19;G06V30/18;G06V10/82;G06V30/22 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 吴荫芳 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 字符 二次 识别 方法 | ||
本发明涉及一种易混字符二次识别方法,用于提高手写字符识别率。对易混字符图像进行细化操作,生成固定大小的目标图像;定义易混字符对“1”、“(”、“)”的直线特征、斜率特征、曲率特征,提取目标图像的特征向量,基于SVM分类器识别分类;定义易混字符对“1”、“9”的孔洞特征,设计基于孔洞特征的分类算法,实现“1”、“9”的二次识别;定义易混字符对“4”、“6”的交截点相对位置特征,设计基于交截点相对位置特征的分类算法,实现“4”、“6”的二次识别;定义易混字符对“7”、“”的夹角特征、方向角特征、连续竖直点个数特征,提取目标图像的特征向量,基于SVM分类器识别分类;本发明可有效提高数学字符的平均识别率。
技术领域
本发明涉及机器学习、手写体识别、特征提取领域,具体涉及一种易混字符二次识别方法。
背景技术
目前的脱机手写识别技术可以实现简易的数学公式的判别,但对于一些具有复杂空间组合及包含关系的手写公式,不能有效地识别。有研究者提出了一种基于编码-解码器框架的新型多模态注意网络,用于手写数学公式识别,该方法在CROHME 2014和CROHME2016数据库上达到了54.05%和50.56%的识别准确率。有研究者实现了一款基于卷积神经网络(CNN)分类算法的脱机手写公式识别系统,实验结果显示,该系统的公式识别准确率为80%。通过分析发现,造成以上研究识别率较低的主要原因在于,数学公式中包含数字、运算符号和字母等,极易出现一些结构特征相似的字符,导致识别率的降低。
基于CNN分类算法对常见的20类数学字符进行识别,统计字符识别率,如图1所示,并找到了四组易混字符对:第一组“1”、“(”、“)”,见图2a)-2c);第二组“1”、“9”,见图3a)-3b);第三组“4”、“6”,见图4a)-4b);第四组“7”、“”,见图5a)-5b)。因此,如何提高这四组易混字符对的识别率成为了脱机手写识别技术的关键。
发明内容
本发明针对上述四组易混字符对提出了一种基于特征提取的二次识别的解决方案。
实现本发明方法的主要步骤如下:对易混字符图像(见图6a))进行细化操作,生成固定大小的目标图像(见图6b));定义易混字符对“1”、“(”、“)”的直线特征、斜率特征、曲率特征,提取目标图像的特征向量,基于SVM分类器识别分类;定义易混字符对“1”、“9”的孔洞特征,设计基于孔洞特征的分类算法,实现“1”、“9”的二次识别;定义易混字符对“4”、“6”的交截点相对位置特征,设计基于交截点相对位置特征的分类算法,实现“4”、“6”的二次识别;定义易混字符对“7”、“”的夹角特征、方向角特征、连续竖直点个数特征,提取目标图像的特征向量,基于SVM分类器识别分类;本发明可有效提高数学字符的平均识别率。
一种易混字符二次识别方法,包括如下步骤:
所述易混字符对“1”、“(”、“)”的二次识别方法为:提取目标图像的特征向量,生成易混字符对数据集,所述特征向量包括:“1”、“(”、“)”的直线特征、斜率特征、曲率特征;利用数据集训练分类模型,利用训练完成的分类器对待识别字符进行二次分类;
所述易混字符对“1”、“9”的二次识别方法为:判断目标图像是否存在孔洞特征,如果存在,则目标图像识别为9,否则,目标图像识别为1;
所述易混字符对“4”、“6”的二次识别方法为:判断目标图像交截点相对位置偏上还是偏下,如果偏上,且目标图像中孔洞特征的最低点不与目标图像最低点重合,则目标图像识别为4,否则,目标图像识别为6;
所述易混字符对“7”、“”的二次识别方法为:提取目标图像的特征向量,生成易混字符对数据集,所述特征向量包括:“7”、“”的夹角特征、方向角特征、连续竖直点个数特征;利用数据集训练分类模型,利用训练完成的分类器对待识别字符进行二次分类。
有益效果
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010184590.3/2.html,转载请声明来源钻瓜专利网。