[发明专利]一种文本标注方法在审
申请号: | 202110306681.4 | 申请日: | 2021-03-23 |
公开(公告)号: | CN113033380A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 张书源 | 申请(专利权)人: | 建信览智科技(北京)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06F40/143;G06F40/279 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100037 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 标注 方法 | ||
1.一种文本标注方法,其特征在于,包括如下步骤:
S1:通过对图像进行人工标注与OCR系统自动识别分别得到实体文字框以及自动检测文字框;
S2:计算实体文字框与自动检测文字框的重叠度,根据重叠度链接两个文字框,得到自动检测文字框的文本;
S3:根据实体文字框从图像中将实体文字影像切出,得到文字条影像;
S4:将得到的文字条影像送入OCR系统进行识别;
S5:将步骤S4中识别出来的文本与步骤S2中自动检测文字框中识别到的文本进行匹配,生成文本标注数据。
2.根据权利要求1所述的文本标注方法,其特征在于,步骤S1中,还包括得到实体文字框的坐标信息,以及通过pixelink算法得到自动检测文字框的坐标信息。
3.根据权利要求2所述的文本标注方法,其特征在于,步骤S1及步骤S2之间还包括对自动检测文字框的坐标信息进行还原,以使OCR系统自动识别后的文字框坐标还原为原始图像的坐标。
4.根据权利要求3所述的文本标注方法,其特征在于,以图像的左上角为坐标原点,坐标还原包括:
当图像缩放m倍后:
x=1/m*x0
y=1/m*y0;
当图像平移(a,b)距离后:
x=x0-a
y=y0-b;
当图像逆时针旋转θ后:
x=(x0*sinθ-y0*cosθ)/(sin2θ-cos2θ)
y=(y0*sinθ-x0*cosθ)/(sin2θ-cos2θ);
其中:x0,y0为自动检测文字框的坐标,x,y为还原为原始图像的坐标。
5.根据权利要求2所述的文本标注方法,其特征在于,步骤S2中,通过实体文字框的坐标信息与自动检测文字框经过还原后的坐标信息计算重叠度。
6.根据权利要求5所述的文本标注方法,其特征在于,步骤S2中,计算实体文字框与自动检测文字框的重叠度包括:
其中:IOU为重叠度,I(X)为两个文字框的交集,U(X)为两个文字框的并集。
7.根据权利要求6所述的文本标注方法,其特征在于,步骤S2中,如果实体文字框与自动检测文字框的重叠度大于0.7,对实体文字框与自动检测文字框进行链接。
8.根据权利要求1所述的文本标注方法,其特征在于,步骤S5中,通过正则表达式,以及最长公共子序列算法对文本进行匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于建信览智科技(北京)有限公司,未经建信览智科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110306681.4/1.html,转载请声明来源钻瓜专利网。