[发明专利]基于运算符作用域和中心线的数学公式识别方法有效
| 申请号: | 202011638890.0 | 申请日: | 2020-12-31 |
| 公开(公告)号: | CN113139548B | 公开(公告)日: | 2022-05-06 |
| 发明(设计)人: | 黄胜;冉浩杉;贾艳秋;张琴 | 申请(专利权)人: | 重庆邮电大学 |
| 主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V10/774;G06V10/82;G06K9/62;G06N3/04 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 400065*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 运算 作用 中心线 数学公式 识别 方法 | ||
1.一种数学公式识别方法的方法,包含以下的步骤:
步骤S1:针对数学公式图片的特点选取连通域与规则相结合的方法进行公式图片切割,获得单个字符图片和字符图片的多种坐标信息,并根据字符图片位置信息按照自左向右、自上向下的顺序排序形成字符图片数据流;
步骤S2:利用浅层卷积神经网络对分割得到的单个字符图片进行字符识别,获得单个字符图片的类别,并更新字符图片数据流对应字符的信息;
步骤S3:对公式结构进行识别,首先搜索公式中运算符号,判断运算符号的类别,根据类别的不同实现对符号的作用域内的子式进行处理;获得对运算符的作用内的子式处理之后的数据流,开始应用中心线的概念,识别公式中的上下标位置关系;
步骤S3的特征在于利用运算符号的作用域固定的特点,将不同种类运算符作用域分为三类,分别是分号、特殊运算符和普通二元运算符号,其中特殊运算符包括根号、求和符号、积分符号大符号,这些运算符有多个作用域;特殊运算符的每个作用域有自己的中心线,每个作用域的所有字符的识别可看成一个子公式的识别;
步骤S3的中心线方法的特征在于:对普通字符间上下标位置关系识别是利用字符在书写时受四线格的约束情况提出中心线的概念;将常见字符分类为向上类、向下类、全占类和中心类,依据字符类型不同采用不同的权值来计算字符的中心线,并根据中心线的范围阈值来判断两个字符或子式之间的位置关系;
假设当前字符图片的是c,n是c的后一个字符;c左上角纵坐标是cy1,右下角纵坐标是cy2;n的左上角和右下角的纵坐标分别是ny1,ny2;center1是c的中心线的纵坐标,center2是n的中心线的纵坐标,range是c上下标出现的范围;center1和center2的计算如下式所示:
center1=a·cy1+b·cy2 (1)
center2=a·ny1+b·ny2 (2)
式中,a和b是不同类型字符计算中心线的系数;
range的计算如下式所示:
range=(cy2-cy1)·line_height_ratio (3)
式中line_height_ratio的选取固定值为0.35;
利用下面条件判断c和n的关系:
if(center1-range)center2(cy2-rangeny2)
n是c的上标;
if(center1+range)center2(cy2+rangeny2)
n是c的下标;
else
n在c的水平右边;
步骤S4:输出公式识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011638890.0/1.html,转载请声明来源钻瓜专利网。





