[发明专利]基于特征与长宽比检测的公式图像区域识别方法及系统在审
申请号: | 202110904935.2 | 申请日: | 2021-08-07 |
公开(公告)号: | CN113705367A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 崔波 | 申请(专利权)人: | 北京惠朗时代科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62 |
代理公司: | 成都鱼爪智云知识产权代理有限公司 51308 | 代理人: | 谷科均 |
地址: | 100176 北京市大兴区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 检测 公式 图像 区域 识别 方法 系统 | ||
本发明公开了一种基于特征与长宽比检测的公式图像区域识别方法,包括以下步骤:获取参考公式图像区域和待识别图像区域;对参考公式图像区域和待识别图像区域进行SIFT特征提取,以得到特征数据;计算参考公式图像区域和待识别图像区域的特征相似度;计算参考公式图像区域的长宽比和待识别图像区域的长宽比,利用绝对差值计算待识别图像区域和参考公式图像区域的长宽比相似度;根据参考公式图像区域和待识别图像区域的特征相似度和长宽比相似度识别确定待识别图像区域的类型。本发明还公开了一种基于特征与长宽比检测的公式图像区域识别方法。本发明将特征相似性检验、长宽比相似性检验进行结合,提高对公式图像区域的识别精度。
技术领域
本发明涉及图像识别技术领域,具体而言,涉及一种基于特征与长宽比检测的公式图像区域识别方法及系统。
背景技术
随着时代的发展,越来越多的论文、申请书、报告等文档出现在我们的生活中,它们也经常以图片的形式展示、交流或者存储。公式往往是论文、申请书中非常重要的部分,当我们要对公式进行识别或者进行编辑的时候,精准地判断出图片中哪部分是公式图像区域是一个非常重要的环节。
针对上述问题,很多专家及学者进行了较为深入的研究。传统的方法往往没有充分考虑公式图像区域的特点,导致了设计的识别方法没有针对性,对于公式图像区域的识别无法保持较高的精度。同时,很多传统方法中都采用了较为复杂的算法或者需要较多的训练样本,极大地增加了计算资源的消耗。因此,如何找到一种针对性强的简易公式图像区域识别方法,能够较高精度地识别出公式图像区域是一项亟待解决且非常有意义的工作。
发明内容
为了克服上述问题或者至少部分地解决上述问题,本发明实施例提供一种基于特征与长宽比检测的公式图像区域识别方法及系统,将特征相似性检验、长宽比相似性检验进行结合,提高对公式图像区域的识别精度。
本发明的实施例是这样实现的:
第一方面,本发明实施例提供一种基于特征与长宽比检测的公式图像区域识别方法,包括以下步骤:
获取参考公式图像区域和待识别图像区域;
对参考公式图像区域和待识别图像区域进行SIFT特征提取,以得到参考公式图像区域和待识别图像区域的特征数据;
根据所述特征数据计算参考公式图像区域和待识别图像区域的特征相似度;
计算参考公式图像区域的长宽比和待识别图像区域的长宽比,利用绝对差值计算待识别图像区域和参考公式图像区域的长宽比相似度;
根据参考公式图像区域和待识别图像区域的特征相似度和长宽比相似度识别确定待识别图像区域的类型。
为了保证对公式图像区域的精准识别,将特征和长宽比进行结合判断,以保证可以得到一个精确的识别结果。当需要对图像区域进行识别时,首先,获取到人工挑选出的部分有代表性的多个公式图像区域,将其作为参考公式图像区域,为后续图像识别提供参考数据,在获取到参考公式图像区域和待识别图像区域后,对多个参考公式图像区域和待识别图像区域进行SIFT特征提取,提取得到参考公式图像区域和待识别图像区域的特征数据;提取到特征数据后,在SIFT特征提取的基础上利用欧式距离,计算待识别图像区域和多个参考公式图像区域的特征相似性;计算多个参考公式图像区域的长宽比和待识别图像区域的长宽比,利用绝对差值计算待识别图像区域和多个参考公式图像区域的长宽比相似性,根据参考公式图像区域和待识别图像区域的特征相似度和长宽比相似度识别确定待识别图像区域的类型,判断其为公式图像区域或者是非公式图像区域,如果待识别图像区域和任意一个公式图像区域的特征相似性较高且待识别图像区域和任意一个公式图像区域的长宽比相似性较高,则判定该待识别图像区域为公式图像区域;如果待识别图像区域和任意一个公式图像区域的特征相似性较高和待识别图像区域和任意一个公式图像区域的长宽比相似性较高任意一条不满足,则判定该待识别图像区域是非公式图像区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京惠朗时代科技有限公司,未经北京惠朗时代科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110904935.2/2.html,转载请声明来源钻瓜专利网。