[发明专利]一种基于目标定位的独立公式的分割方法有效
申请号: | 201910864395.2 | 申请日: | 2019-09-12 |
公开(公告)号: | CN110569853B | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 田博帆 | 申请(专利权)人: | 南京红松信息技术有限公司 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/19 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 顾伯兴 |
地址: | 210022 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 目标 定位 独立 公式 分割 方法 | ||
1.一种基于目标定位的独立公式的分割方法,其特征在于,具体包括以下步骤:
(1)字符检测定位:通过目标检测算法对公式中的每个字符进行定位检测,根据检测和定位的结果输出字符的定位坐标和所述字符的内容;
(2)字符按序排列:将所述定位坐标作为参考,将定位的每行的所述字符按照所述定位坐标进行排序,得到有序序列X;
(3)按行筛选字符:每次选取第一个字符作为一行的参考字符,从剩下的字符中筛选出与该第一个字符处于同一行的其他字符组成序列,将有序序列X减去该一行字符序列得到新的待排序序列,再次递归排序直到待排序序列为空,即完成所有行字符的筛选;
(4)独立公式裁剪:根据一行中每个字符的坐标计算所述每个字符之间的间隔距离,再计算每个字符之间的前后间隔的比率大小,根据间隔的比率大小进行筛选排序,再通过排序后的字符推算出每个独立公式所对应的首尾字符,再根据首尾字符的坐标实现独立公式的定位。
2.根据权利要求1所述的基于目标定位的独立公式的分割方法,其特征在于,所述步骤(1)中采用的目标检测算法为YOLO v3算法,所述YOLO v3算法对文本做检测的计算过程为:
S1:对公式图片中的每个字符进行标注;
S2:通过DarkNet53网络对每个字符进行特征提取;并采用不同尺度的特征图对提取的特征进行目标检测;
S3:将DarkNet53网络产出的不同尺度的所述特征图作为输入,以FPN(featurepyramid networks)算法作为参考,通过卷积层和上采样对不同尺度的特征图进行融合,从而实现快速的对图片公式中的每个字符进行定位和检测。
3.根据权利要求2所述的基于目标定位的独立公式的分割方法,其特征在于,所述步骤(1)中根据检测和定位的结果,分别输出每个字符定位框的左上角点坐标(left_x,left_y)和右下角点坐标(right_x,right_y)以及该字符的内容。
4.根据权利要求2所述的基于目标定位的独立公式的分割方法,其特征在于,所述步骤(2)中所述有序序列X,记作X={x0,x1,x2,…,xn},n表示所有行字符的总个数。
5.根据权利要求2所述的基于目标定位的独立公式的分割方法,其特征在于,所述步骤(3)具体为:为了从有序序列X中筛选出每行字符,每次选取第一个字符X0作为某一行的参考字符,从剩下的n-1个字符中筛选出与该字符X0处于同一行的其他字符组成序列,记作Xl;将所述有序序列X减去l行字符序列Xl得到新的待排序序列;再次递归排序直到待排序序列为空,直至完成所有行字符的筛选。
6.根据权利要求5所述的基于目标定位的独立公式的分割方法,其特征在于,所述步骤(3)中采用字符共线概念进行字符的筛选,具体为:每种字符的实际可能位置都作为筛选的条件之一;其中,第一种字符表示它的左上角点y轴坐标大于参考字符左上角点y轴坐标且它的右下角点y轴坐标小于参考字符右下角点y轴坐标;第二种字符表示它的左上角点y轴坐标小于参考字符左上角点y轴坐标且它的右下角点y轴坐标大于参考字符右下角点y轴坐标;第三种字符表示它的左上角点y轴坐标小于参考字符左上角点y轴坐标且它的右下角点y轴坐标大于参考字符左上角点y轴坐标;第四种字符表示它的左上角点y轴坐标小于参考字符右下角点y轴坐标且它的右下角点y轴坐标大于参考字符右下角点y轴坐标;第五种字符称为理想型共线字符,它表示字符的左上角点y轴坐标小于等于参考字符的中轴线y轴坐标且字符的右下角点y轴坐标大于等于中轴线y轴坐标。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京红松信息技术有限公司,未经南京红松信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910864395.2/1.html,转载请声明来源钻瓜专利网。