[发明专利]一种基于目标定位的独立公式的分割方法有效
申请号: | 201910864395.2 | 申请日: | 2019-09-12 |
公开(公告)号: | CN110569853B | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 田博帆 | 申请(专利权)人: | 南京红松信息技术有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/19 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 顾伯兴 |
地址: | 210022 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 目标 定位 独立 公式 分割 方法 | ||
本发明公开了一种基于目标定位的独立公式的分割方法,包括以下步骤:(1)字符检测定位:通过目标检测算法对公式中的每个字符进行定位检测,输出字符的定位坐标和内容;(2)字符按序排列:将定位的每行的所述字符按照所述定位坐标进行排序,得到有序序列;(3)按行筛选字符:每次选取第一个字符作为参考字符,从剩下的字符中筛选出与该第一个字符处于同一行的其他字符组成序列,将有序序列减去该一行字符序列得到新的待排序序列,再次递归排序直到待排序序列为空;(4)独立公式裁剪:计算每个字符之间的前后间隔的比率大小,进行筛选排序,再通过排序后的字符推算出每个独立公式所对应的首尾字符,从而实现独立公式的定位。
技术领域
本发明属于图像分割技术领域,尤其是涉及一种基于目标定位的独立公式的分割方法。
背景技术
随着人工智能的发展,自动批阅系统渐趋成熟,众多针对图像处理的研究技术层出不穷,其中独立公式分割技术成为了自动批阅系统的首要核心技术。当前大量研究表明,对图像中公式的检测,主要是通过图像的像素信息分析字符的轮廓来获取独立公式的结构特征,并根据获取到的结构特征对独立公式做出检测和分割。而通常依赖图像做像素级检测的方法不仅较为繁琐,而且检测效果往往并不理想,这些方法对图片的质量提出了较高要求,任何含有对公式结构特征带来干扰的信息图像,都将使学习到这类特征的准确性受到影响,检测变得十分困难。因此,本申请采用深度学习方法结合坐标计算原理对独立公式分割技术做出相关研究。
因此,有必要开发一种基于目标定位的独立公式的分割方法,对同时含有印刷体和手写体图片中的手写体部分做出精确定位,提高文本识别系统的精确度。
发明内容
本发明要解决的技术问题是,提供一种基于目标定位的独立公式的分割方法,能够对同时含有手写体和印刷体的图像做独立公式检测和分割。
为解决上述技术问题,本发明采用的技术方案是:该基于目标定位的独立公式的分割方法,具体包括以下步骤:
(1)字符检测定位:通过目标检测算法对公式中的每个字符进行定位检测,根据检测和定位的结果输出字符的定位坐标和所述字符的内容;
(2)字符按序排列:将所述定位坐标作为参考,将定位的每行的所述字符按照所述定位坐标进行排序,得到有序序列X;
(3)按行筛选字符:每次选取第一个字符作为一行的参考字符,从剩下的字符中筛选出与该第一个字符处于同一行的其他字符组成序列,将有序序列X 减去该一行字符序列得到新的待排序序列,再次递归排序直到待排序序列为空,即完成所有行字符的筛选;
(4)独立公式裁剪:根据一行中每个字符的坐标计算所述每个字符之间的间隔距离,再计算每个字符之间的前后间隔的比率大小,根据间隔的比率大小进行筛选排序,再通过排序后的字符推算出每个独立公式所对应的首尾字符,再根据首尾字符的坐标实现独立公式的定位。
采用上述技术方案,通过字符检测定位,得到字符的坐标,再根据字符的坐标进行排序和筛选,从而获得字符的定位并裁剪出独立的公式;当提供含有口算公式的图片时,不需要借助复杂的图像处理技术和考虑字符干扰的情况下,该技术能够对含有多个公式的图片实现独立公式的分割。
作为本发明的优选技术方案,所述步骤(1)中采用的目标检测算法为YOLO v3算法,所述YOLO v3算法对文本做检测的计算过程为:
S1:对公式图片中的每个字符进行标注;
S2:通过DarkNet53网络对每个字符进行特征提取;并采用不同尺度的特征图对提取的特征进行目标检测;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京红松信息技术有限公司,未经南京红松信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910864395.2/2.html,转载请声明来源钻瓜专利网。