[发明专利]一种手写体数学公式离线识别方法及系统在审
| 申请号: | 201711049724.5 | 申请日: | 2017-10-31 |
| 公开(公告)号: | CN107729865A | 公开(公告)日: | 2018-02-23 |
| 发明(设计)人: | 董兰芳;刘汉超 | 申请(专利权)人: | 中国科学技术大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/62;G06N3/04 |
| 代理公司: | 北京凯特来知识产权代理有限公司11260 | 代理人: | 郑立明,郑哲 |
| 地址: | 230026 安*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 手写体 数学公式 离线 识别 方法 系统 | ||
1.一种离线手写体数学公式识别方法,其特征在于,包括:
将手写体数学公式按照连通域进行分割,将获得的字符部件序列中的字符部件两两组合为字符部件对,并使用SVM分类器将字符部件对分类,再根据分类结果将属于同一字符的字符部件组合,获得若干字符;
利用基于批量归一化和全局平均池化算法的卷积神经网络进行字符识别,获得字符的类别和字符的位置关系;对于无法识别的字符,看作粘连字符,对粘连字符进行分割操作后再进行字符识别操作;
根据字符的类别和位置关系对字符的组合进行几何和语义约束,再结合CYK算法自下而上的完成公式的重构。
2.根据权利要求1所述的一种离线手写体数学公式识别方法,其特征在于,将获得的字符部件序列中的字符部件两两进行组合为字符部件对,并使用SVM分类器将字符部件对分类,再根据分类结果将属于同一字符的字符部件组合的步骤如下:
根据得到的字符部件序列W{W0,W1,...,Wn}中字符部件之间的位置关系,将字符部件两两组合为字符部件对pm=(Wi,Wj),0≤m≤n-1,0≤i,j≤n,i≠j;
提取字符部件对pm=(Wi,Wj)中两个字符部件Wi与Wj之间的几何关系特征,作为字符部件对pm的特征;其中几何关系特征包括:两字符部件的包围盒中心距离、两字符部件图像质心距离、两字符部件的最短距离、包围盒水平重叠区域和/或竖直重叠区域;
根据字符部件对的几何关系特征,将字符部件对分为组合类与分离类,其中属于组合类的字符部件对中两字符部件属于同一字符,属于分离类的字符部件对中两部件不属于同一字符,使用监督学习的方法训练SVM分类器,完成对字符部件对的分类;
将相邻的且属于同一字符的字符部件组合,完成断裂字符的分割。
3.根据权利要求1所述的一种离线手写体数学公式识别方法,其特征在于,所述基于批量归一化和全局平均池化算法的卷积神经网络,使用1×1和3×3大小的卷积核,卷积神经网络包括:依次设置的第一卷积层、第一池化层、第二卷积层、第二池化层、第三卷积层、第三池化层、第四卷积层、第四池化层、第五卷积层、全局平均池化层以及softmax层;
其中,每个卷积层后都通过批量归一化算法进行归一化处理,全局平均池化层用于计算每个特征图的全局平均值;
所述通过批量归一化算法进行归一化处理包括:
首先,将数据归一化,运算操作如下:
其中,x(k)为第k批数据,E[x(k)]为第k批数据的均值,表示第k批数据的方差;
然后,通过学习恢复出相应卷积层学习到的特征分布:
其中,γ(k)与β(k)为对应于第k批数据的可学习变量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711049724.5/1.html,转载请声明来源钻瓜专利网。





