[发明专利]适用于结构化的数学公式的识别方法在审
申请号: | 201811553719.2 | 申请日: | 2018-12-19 |
公开(公告)号: | CN109685061A | 公开(公告)日: | 2019-04-26 |
发明(设计)人: | 陈丽华 | 申请(专利权)人: | 上海丕休智能科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 北京挺立专利事务所(普通合伙) 11265 | 代理人: | 刘阳 |
地址: | 201207 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数学公式 图像 二值化处理 结构化 倾斜图像校正 格式输出 图像校正 易用性 有效地 准确率 灰度 文档 分行 | ||
本发明公开了一种适用于结构化的数学公式的识别方法,获取待识别图像,并根据灰度值对待识别图像进行二值化处理,其中,待识别图像为数学公式;对完成二值化处理后的图像进行倾斜图像校正;对完成图像校正后的数学公式分行,并完成多个符号的提取与识别操作。该方法可以有效地提高文档中数学公式的识别准确率,并将识别结果以MathML格式输出,且具有识别的灵活性与易用性。
技术领域
本发明涉及图像识别技术领域,特别涉及一种适用于结构化的数学公式的识别方法。
背景技术
现有技术中,随着互联网技术快速发展以及智能手机的普及,图像已经成为人们记录和分享信息的主要方式,由此催生了大量以拍照作为检索输入的应用的产生。OCR(Optical Character Recognition,光学字符识别)技术,是通过扫描等光学输入方式将各种票据、报刊、书籍、文稿及其它印刷品的文字转化为图像信息,再利用文字识别技术将图像信息转化为可以使用的计算机输入技术。OCR技术可广泛地应用于银行票据、大量文字资料、档案卷宗、文案的录入、处理以及检索等领域。公式作为一种符号化的信息表达方式,也可以看作成一种文字。公式图像识别对于含有公式的图像的处理起着重要的作用。比如现在的“拍照搜题”软件中,有许多图像是含有公式的,甚至是只有公式没有文字,如果能够快速,高效地识别这些公式,对于题目检索会起到很大的帮助。
发明内容
基于此,有必要针对传统技术存在的问题,提供一种适用于结构化的数学公式的识别方法。获取待识别图像,并根据灰度值对所述待识别图像进行二值化处理,其中,待识别图像为数学公式;对完成二值化处理后的图像进行倾斜图像校正;对完成图像校正后的数学公式分行,并完成多个符号的提取与识别操作。通过本公开提出的适用于结构化的数学公式的识别方法可以有效地提高文档中数学公式的识别准确率,并将识别结果以MathML格式输出。
第一方面,本发明实施例提供了一种适用于结构化的数学公式的识别方法,所述方法包括:获取待识别图像,并根据灰度值对所述待识别图像进行二值化处理,其中,所述待识别图像为数学公式;对完成二值化处理后的图像进行倾斜图像校正;对完成图像校正后的数学公式分行,并完成多个符号的提取与识别操作。
在其中一个实施例中,还包括:在获取待识别图像之前,创建标准字符模板库,所述创建标准字符模板库包括:采集清晰的标准符号图片,并对所述标准符号图片进行去除多余的空白处理,生成标准符号的外接矩形图片;将生成标准符号的所述外接矩形图片归一化为36乘36像素的正方形图片,且记录所述正方形图片的高度和宽度之比。
在其中一个实施例中,所述根据灰度值对所述待识别图像进行二值化处理包括:计算所述待识别图像上每个像素点的灰度,并设定灰度阀值;当监测到的灰度值大于所述灰度阀值,则标记为黑点;当监测到的灰度值小于所述灰度阈值,则标记为白点。
在其中一个实施例中,所述对完成二值化处理后的图像进行倾斜图像校正包括:对所述待识别图像根据水平方向X轴和垂直方向Y轴进行原点设定操作;根据预设坐标变换算法对完成设定的所述待识别图像进行校正操作,其中所述坐标变换算法为调用opencv函数实现。
在其中一个实施例中,所述对完成图像校正后的数学公式分行包括:根据像素点的纵轴左边,从上到下依次遍历每一行的像素点;若该行上所有像素点的灰度均为白点,则当前行定义为公式之间的分隔行。
在其中一个实施例中,所述完成多个符号的提取与识别操作包括单行公式中简单字符的提取和识别,所述单行公式中简单字符的提取和识别具体为:对完成分行后的图像,通过提取像素点的灰度为黑点的连续像素点作为单行公式中的单个字符;计算所述单个字符的高度、宽度数值,并对高度与宽度数值通过归一化操作为36*36像素的正方形图像;将获取的完成归一化的图像与预先建立的模板库中的标准字进行匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海丕休智能科技有限公司,未经上海丕休智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811553719.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图像处理方法和装置
- 下一篇:一种目标检测方法、装置、设备及存储介质
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序