[发明专利]一种数学公式识别方法、装置、设备及存储介质有效
申请号: | 201810921145.3 | 申请日: | 2018-08-14 |
公开(公告)号: | CN109241861B | 公开(公告)日: | 2022-02-25 |
发明(设计)人: | 曾金舟;何春江 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06T3/40 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王云晓;王宝筠 |
地址: | 230088 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数学公式 识别 方法 装置 设备 存储 介质 | ||
本申请提供了一种数学公式识别方法、装置、设备及存储介质,方法包括:获取待识别图像;利用预设的公式判别规则和/或预先建立的公式判别模型,判别待识别图像是否为公式图像;若待识别图像为公式图像,利用预先建立的公式识别模型从待识别图像中识别出目标公式。本申请一方面能够判别出待识别图像是否为公式图像,从而能够避免后续对非公式图像进行识别所带来的计算资源浪费,另一方面,在对公式图像进行识别时,可利用公式识别模型直接对待识别图像进行整图识别,从而能够直接获得整幅图像的识别结果,即能够从待识别图像中直接识别出整个公式,识别效率较高,识别效果较好。
技术领域
本申请涉及信息识别技术领域,尤其涉及一种数学公式识别方法、装置、 设备及存储介质。
背景技术
随着科技的进步和互联网技术的飞速发展,信息产业也在迅速兴起,此 间,扫描文档的识别任务也是雨后春笋,同时,文档识别的相关应用也遍及 各行各业,对人们的生活方式和工作方式带来了不同程度的影响。影响最深 的当属现代化的教育领域,社会发展给教育行业带来了巨大变革,教育方式 由传统的纸笔教育进入信息化教育,然而,信息化教育中数学公式的识别一 直以来都是一个亟待解决的问题。
发明内容
有鉴于此,本申请提供了一种数学公式识别方法、装置、设备及存储介 质,用以实现对数学公式的识别,其技术方案如下:
一种数学公式识别方法,包括:
获取待识别图像;
利用预设的公式判别规则和/或预先建立的公式判别模型,判别所述待识 别图像是否为公式图像;
若所述待识别图像为公式图像,利用预先建立的公式识别模型从所述待 识别图像中识别出目标公式。
其中,利用预设的所述公式判别规则和预先建立的所述公式判别模型, 判别所述待识别图像是否为公式图像,包括:
先利用所述公式判别规则判别所述待识别图像是否为公式图像;
若利用所述公式判别规则判别出所述待识别图像为公式图像,则将所述 待识别图像作为候选公式图像,进一步利用所述公式判别模型判别所述待识 别图像是否为公式图像。
其中,所述利用所述公式判别规则判别所述待识别图像是否为公式图 像,包括:
基于公式图像的尺寸和/或公式的几何特征,判别所述待识别图像是否为 公式图像。
其中,所述基于公式的几何特征判别所述待识别图像是否为公式图像, 包括:
对所述待识别图像进行二值化处理,二值化处理后的图像作为第一目标 二值化图像;
在所述第一目标二值化图像中寻找连通体;
基于连通体之间的距离和/或连通体的高度,和/或,连通体在所述第一 目标二值化图像中所占的面积,和/或,代表直线的连通体的数量,确定所述 待识别图像是否为公式图像。
其中,利用所述公式判别模型判别所述待识别图像是否为公式图像,包 括:
确定所述待识别图像中字符的平均高度作为平均字符高度;
基于所述平均字符高度对所述待识别图像进行等比例缩放处理,将缩放 处理后的图像作为所述公式判别模型的输入图像;
将所述输入图像调整成尺寸满足所述公式判别模型的输入要求的图像 并输入所述公式判别模型,获得所述公式判别模型输出的指示待识别图像是 否为公式图像的判别结果。
其中,所述确定所述待识别图像中字符的平均高度作为平均字符高度, 包括:
从所述待识别图像中确定高度大于预设值的字符作为目标字符;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810921145.3/2.html,转载请声明来源钻瓜专利网。