[发明专利]图片中公式的识别方法、装置及存储介质在审

申请号：	202110730258.7	申请日：	2021-06-29
公开（公告）号：	CN113610073A	公开（公告）日：	2021-11-05
发明（设计）人：	赵志勇;王杰;辛晓哲;秦波;苏雪峰	申请（专利权）人：	北京搜狗科技发展有限公司
主分类号：	G06K9/20	分类号：	G06K9/20;G06K9/34;G06K9/62;G06T7/11;G06T7/70
代理公司：	北京华沛德权律师事务所 11302	代理人：	房德权
地址：	100084 北京市海淀区中关***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	图片公式识别方法装置存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种图片中公式的识别方法、装置及存储介质，涉及识别技术领域，主要为解决目前图片中公式的识别的效果较差的问题。该方法包括：获取待识别图片，并从待识别图片中确定目标区域，目标区域为至少一个，目标区域为包含有公式的区域；将目标区域进行划分，得到多个识别区域，识别区域为包含至少一个公式的区域，公式包含多个公式单元；对一个或者多个所述公式单元进行识别，得到对应公式识别结果；将所述公式识别结果输出。基于上述方法可以确保在在图片中公式识别的过程中，可以在当待识别图片中包含内容较多、较为复杂情况下的具有较好的公式识别效果，解决了目前图片中公式的识别效果较差的问题。

技术领域

本发明涉及识别技术领域，尤其涉及一种图片中公式的识别方法、装置及存储介质。

背景技术

随着智能识别技术的逐步发展，对于图片中的内容进行识别的场景和需求也逐步增多。

通常，在常规方式对图片中公式进行识别的过程中，一般需要单独提供一张仅包含公式的图片，且该图片内的公式要相对简单，这样才能通过识别模型对这种图片进行识别。然而，在实际应用中，当图片中不仅包含公式本身，还包含其他图像、文字等内容时，或者是公式本身是由多个不同的行列内的简单公式组成时，现有公式识别方法会由于图片中的内容过于复杂导致识别失败。

发明内容

鉴于上述问题，本发明提供一种图片中公式的识别方法、装置及存储介质，主要目的在于解决目前图片中公式的识别的效果较差的问题。

为解决上述技术问题，第一方面，本发明提供了一种图片中公式的识别方法，该方法包括：

获取待识别图片，并从所述待识别图片中确定目标区域，其中，所述目标区域为至少一个；所述目标区域为包含有公式的区域；

将所述目标区域进行划分，得到一个或者多个识别区域，其中，所述识别区域包含至少一个公式的区域，所述公式包含多个所述公式单元；

对一个或者多个所述公式单元进行识别，得到对应公式识别结果；

将所述公式识别结果输出。

可选的，所述将所述目标区域进行划分，得到一个或者多个识别区域包括：

从所述目标区域中确定每个所述识别区域；

获取每个所述识别区域对应的位置信息；

在所述将所述公式识别结果输出之前，所述方法还包括：

按照所述位置信息将多个所述识别区域对应的识别结果进行组合，得到所述组合结果，所述组合结果用于表征多个所述公式单元组成的所述公式；