[发明专利]公式文字自动识别方法在审

申请号：	202010882612.3	申请日：	2020-08-28
公开（公告）号：	CN112016460A	公开（公告）日：	2020-12-01
发明（设计）人：	樊星	申请（专利权）人：	上海松鼠课堂人工智能科技有限公司
主分类号：	G06K9/00	分类号：	G06K9/00;G06K9/34;G06K9/46
代理公司：	暂无信息	代理人：	暂无信息
地址：	200237 上海市徐***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	公式文字自动识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种公式文字自动识别方法，所述方法包括：根据自动识别触发指令，接收待识别信息，获取所述待识别信息中包含的待识别的公式文字的原始图像；分析所述原始图像是否需要进行图像处理，并根据分析结果，输出对应的待识别图像；对输出的所述待识别图像进行公式文字的自动识别，得到识别出的公式信息；达到了自动识别公式文字的目的，提高了公式文字识别的效率，同时也提高了识别的准确率。

技术领域

本发明涉及信息识别技术领域，特别涉及一种公式文字自动识别方法。

背景技术

随着互联网和计算机技术的不断发展进步，利用互联网进行线上教育的方式也越来越多地被人们所接受，线上教育的形式也越来越多样化。数学公式因其包含了不同的数学运算符号，在进行信息识别和数据处理时，若按照常规的文字识别方式进行处理，通常会识别出乱码或者不能识别的情况。因此，在进行信息识别和数据处理时，针对数学公式和其他的文字，如何进行公式文字的自动识别成为目前亟待解决的问题之一。

发明内容

本发明提供一种公式文字自动识别方法，旨在正确地识别出公式和文字，提高信息识别的准确率。

本发明提供了一种公式文字自动识别方法，所述公式文字自动识别方法包括：

根据自动识别触发指令，接收待识别信息，获取所述待识别信息中包含的待识别的公式文字的原始图像；

分析所述原始图像是否需要进行图像处理，并根据分析结果，输出对应的待识别图像；

对输出的所述待识别图像进行公式文字的自动识别，得到识别出的公式信息。

进一步地，所述分析所述原始图像是否需要进行图像处理，并根据分析结果，输出对应的待识别图像，包括：

判断所述原始图像的模糊程度是否达到预设模糊程度，如果是，则对所述原始图像进行去模糊处理，将去模糊处理后的原始图像作为待识别图像；如果否，则将所述原始图像作为待识别图像；

所述对输出的所述待识别图像进行公式文字的自动识别，得到识别出的公式信息，包括：

从所述待识别图像中截取单独的每个公式各自的公式所在区域；

从所述公式所在区域中识别任一个英文字母或者任一个数字；

根据所述识别出的英文字母或者数字的书写方向，确定所述公式所在区域中公式的书写方向；