[发明专利]公式文字自动识别方法在审
| 申请号: | 202010882612.3 | 申请日: | 2020-08-28 |
| 公开(公告)号: | CN112016460A | 公开(公告)日: | 2020-12-01 |
| 发明(设计)人: | 樊星 | 申请(专利权)人: | 上海松鼠课堂人工智能科技有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06K9/46 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 200237 上海市徐*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 公式 文字 自动识别 方法 | ||
本发明公开了一种公式文字自动识别方法,所述方法包括:根据自动识别触发指令,接收待识别信息,获取所述待识别信息中包含的待识别的公式文字的原始图像;分析所述原始图像是否需要进行图像处理,并根据分析结果,输出对应的待识别图像;对输出的所述待识别图像进行公式文字的自动识别,得到识别出的公式信息;达到了自动识别公式文字的目的,提高了公式文字识别的效率,同时也提高了识别的准确率。
技术领域
本发明涉及信息识别技术领域,特别涉及一种公式文字自动识别方法。
背景技术
随着互联网和计算机技术的不断发展进步,利用互联网进行线上教育的方式也越来越多地被人们所接受,线上教育的形式也越来越多样化。数学公式因其包含了不同的数学运算符号,在进行信息识别和数据处理时,若按照常规的文字识别方式进行处理,通常会识别出乱码或者不能识别的情况。因此,在进行信息识别和数据处理时,针对数学公式和其他的文字,如何进行公式文字的自动识别成为目前亟待解决的问题之一。
发明内容
本发明提供一种公式文字自动识别方法,旨在正确地识别出公式和文字,提高信息识别的准确率。
本发明提供了一种公式文字自动识别方法,所述公式文字自动识别方法包括:
根据自动识别触发指令,接收待识别信息,获取所述待识别信息中包含的待识别的公式文字的原始图像;
分析所述原始图像是否需要进行图像处理,并根据分析结果,输出对应的待识别图像;
对输出的所述待识别图像进行公式文字的自动识别,得到识别出的公式信息。
进一步地,所述分析所述原始图像是否需要进行图像处理,并根据分析结果,输出对应的待识别图像,包括:
判断所述原始图像的模糊程度是否达到预设模糊程度,如果是,则对所述原始图像进行去模糊处理,将去模糊处理后的原始图像作为待识别图像;如果否,则将所述原始图像作为待识别图像;
所述对输出的所述待识别图像进行公式文字的自动识别,得到识别出的公式信息,包括:
从所述待识别图像中截取单独的每个公式各自的公式所在区域;
从所述公式所在区域中识别任一个英文字母或者任一个数字;
根据所述识别出的英文字母或者数字的书写方向,确定所述公式所在区域中公式的书写方向;
确定出所述公式所在区域中公式的书写方向之后,将所述公式所在区域进行网格划分,将所述公式所在区域划分为由多个正方形网格构成的网格区域;
逐个对位于所述网格区域内的公式符号局部形状进行识别,获得每个网格区域内包括的公式符号局部形状;
沿着所述公式的书写方向,依序将所述网格区域内的公式符号局部形状进行拼接,获得位于所述公式所在区域内的、沿着所述公式的书写方向的各个公式符号;
从预设的符号数据库中,查找所述获得的各个公式符号各自对应的标准符号书写模板;
按照各个公式符号在所述公式所在区域中的位置进行拼接,获得所述待识别图像中所述公式所在区域对应的公式。
进一步地,所述获取所述待识别信息中包含的待识别的公式文字的原始图像,包括:
基于接收到的所述待识别信息,监测基于所述待识别信息触发的选择指令;
响应基于所述待识别信息触发的所述选择指令,获取所述选择指令映射的待识别的原始图像。
进一步地,所述分析所述原始图像是否需要进行图像处理,包括:
设置对应的预设基准图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海松鼠课堂人工智能科技有限公司,未经上海松鼠课堂人工智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010882612.3/2.html,转载请声明来源钻瓜专利网。





