[发明专利]一种文本标注方法在审

专利信息
申请号: 202110306681.4 申请日: 2021-03-23
公开(公告)号: CN113033380A 公开(公告)日: 2021-06-25
发明(设计)人: 张书源 申请(专利权)人: 建信览智科技(北京)有限公司
主分类号: G06K9/00 分类号: G06K9/00;G06K9/20;G06F40/143;G06F40/279
代理公司: 暂无信息 代理人: 暂无信息
地址: 100037 北京市西*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 文本 标注 方法
【权利要求书】:

1.一种文本标注方法,其特征在于,包括如下步骤:

S1:通过对图像进行人工标注与OCR系统自动识别分别得到实体文字框以及自动检测文字框;

S2:计算实体文字框与自动检测文字框的重叠度,根据重叠度链接两个文字框,得到自动检测文字框的文本;

S3:根据实体文字框从图像中将实体文字影像切出,得到文字条影像;

S4:将得到的文字条影像送入OCR系统进行识别;

S5:将步骤S4中识别出来的文本与步骤S2中自动检测文字框中识别到的文本进行匹配,生成文本标注数据。

2.根据权利要求1所述的文本标注方法,其特征在于,步骤S1中,还包括得到实体文字框的坐标信息,以及通过pixelink算法得到自动检测文字框的坐标信息。

3.根据权利要求2所述的文本标注方法,其特征在于,步骤S1及步骤S2之间还包括对自动检测文字框的坐标信息进行还原,以使OCR系统自动识别后的文字框坐标还原为原始图像的坐标。

4.根据权利要求3所述的文本标注方法,其特征在于,以图像的左上角为坐标原点,坐标还原包括:

当图像缩放m倍后:

x=1/m*x0

y=1/m*y0

当图像平移(a,b)距离后:

x=x0-a

y=y0-b;

当图像逆时针旋转θ后:

x=(x0*sinθ-y0*cosθ)/(sin2θ-cos2θ)

y=(y0*sinθ-x0*cosθ)/(sin2θ-cos2θ);

其中:x0,y0为自动检测文字框的坐标,x,y为还原为原始图像的坐标。

5.根据权利要求2所述的文本标注方法,其特征在于,步骤S2中,通过实体文字框的坐标信息与自动检测文字框经过还原后的坐标信息计算重叠度。

6.根据权利要求5所述的文本标注方法,其特征在于,步骤S2中,计算实体文字框与自动检测文字框的重叠度包括:

其中:IOU为重叠度,I(X)为两个文字框的交集,U(X)为两个文字框的并集。

7.根据权利要求6所述的文本标注方法,其特征在于,步骤S2中,如果实体文字框与自动检测文字框的重叠度大于0.7,对实体文字框与自动检测文字框进行链接。

8.根据权利要求1所述的文本标注方法,其特征在于,步骤S5中,通过正则表达式,以及最长公共子序列算法对文本进行匹配。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于建信览智科技(北京)有限公司,未经建信览智科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110306681.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top