[发明专利]公式识别方法和装置有效
申请号: | 201510064672.3 | 申请日: | 2015-02-06 |
公开(公告)号: | CN104636741B | 公开(公告)日: | 2018-04-13 |
发明(设计)人: | 吴仑;王岩;梁爽;陈恭明;邹静 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/54 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙)11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 公式 识别 方法 装置 | ||
技术领域
本发明涉及互联网技术领域,尤其涉及一种公式识别方法和装置。
背景技术
随着互联网技术快速发展以及智能手机的普及,图像已经成为人们记录和分享信息的主要方式,由此催生了大量以拍照作为检索输入的应用的产生。作为一种新的问答形式,以图像作为输入的自动答题系统越来越引起人们的关注。
在自动答题系统中,对于数学公式的检测、识别以及检索是三个关键的问题。目前常见的公式检测和识别方法主要应用在长文本图像中,由于长文本图像中具有丰富的全局信息,版面中的各种元素具有较大的区分度,利用一些简单的统计属性的差异就可以相对容易的定位公式,从而建立相对全面的基于文本内容的数据库。但是对于短文本来说,公式、文本和图表在版面中的比例相差不大,因此基于长本文的统计属性不适用于短文本。另外现有的公式识别方法多使用在一些光照变化不大、相对清晰、形变较小的长文本图像上,而对于用户随意输入的短文本图像的鲁棒性较低。
发明内容
本发明的目的旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的第一个目的在于提出一种公式识别方法。该方法可以有效地提高短文本图像中的有效信息,减少乱码的出现,进而可以提高整个答题系统的准确率。
本发明的第二个目的在于提出一种公式识别装置。
为了实现上述目的,本发明第一方面实施例的公式识别方法,包括:对图像版面进行扭曲矫正;对矫正后的图像版面中的基本元素进行分割,根据所述图像版面中基本元素的特征确定所述基本元素所在区域为公式区域;根据公式符号对所述公式区域进行公式识别。
本发明实施例的公式识别方法,对图像版面进行扭曲矫正之后,对矫正后的图像版面中的基本元素进行分割,根据图像版面中基本元素的特征确定上述基本元素所在区域为公式区域,最后根据公式符号对上述公式区域进行公式识别,从而可以实现利用短文本图像中的多种局部特性,对短文本图像中的公式进行检测和识别,可以有效地提高短文本图像中的有效信息,减少乱码的出现,进而可以提高整个答题系统的准确率。
为了实现上述目的,本发明第二方面实施例的公式识别装置,包括:矫正模块,用于对图像版面进行扭曲矫正;分割模块,用于对所述矫正模块矫正后的图像版面中的基本元素进行分割;确定模块,用于根据所述图像版面中基本元素的特征确定所述基本元素所在区域为公式区域;识别模块,用于根据公式符号对所述确定模块确定的公式区域进行公式识别。
本发明实施例的公式识别装置,矫正模块对图像版面进行扭曲矫正之后,分割模块对矫正后的图像版面中的基本元素进行分割,确定模块根据图像版面中基本元素的特征确定上述基本元素所在区域为公式区域,最后识别模块根据公式符号对确定模块确定的公式区域进行公式识别,从而可以实现利用短文本图像中的多种局部特性,对短文本图像中的公式进行检测和识别,可以有效地提高短文本图像中的有效信息,减少乱码的出现,进而可以提高整个答题系统的准确率。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为本发明公式识别方法一个实施例的流程图;
图2为本发明公式识别装置一个实施例的结构示意图;
图3为本发明公式识别装置另一个实施例的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。相反,本发明的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。
图1为本发明公式识别方法一个实施例的流程图,如图1所示,该公式识别方法可以包括:
步骤101,对图像版面进行扭曲矫正。
在用户输入的短文本图像中,经常会出现图形的旋转以及扭曲变形,这会导致图像版面中基本元素的分割不准确,从而产生错行、串行等划分错误,进而无法对公式进行准确地识别。因此,本实施例中,需要先对图像版面进行扭曲矫正,以对图像版面中的基本元素进行准确分割。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510064672.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种号牌识别的方法及装置
- 下一篇:测量数据电子化装置和测量数据电子化方法