[发明专利]一种文本标注方法在审
申请号: | 202110306681.4 | 申请日: | 2021-03-23 |
公开(公告)号: | CN113033380A | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 张书源 | 申请(专利权)人: | 建信览智科技(北京)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/20;G06F40/143;G06F40/279 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100037 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种文本标注方法,包括以下步骤:S1:通过对图像进行人工标注与OCR系统自动识别分别得到实体文字框以及自动检测文字框;S2:计算实体文字框与自动检测文字框的重叠度,根据重叠度链接两个文字框,得到自动检测文字框的文字信息;S3:根据实体文字框从图像中将实体文字影像切出,得到文字条影像;S4:将得到的文字条影像送入OCR系统进行识别;S5:将步骤S4中识别出来的文本与步骤S2中自动检测文字框中识别到的文本进行匹配,生成文本标注数据。本发明中的文本标注方法,通过在图像上标注实体,能够做到标注和OCR系统解耦,使OCR系统的迭代升级不会对标注结果造成影响。 | ||
搜索关键词: | 一种 文本 标注 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于建信览智科技(北京)有限公司,未经建信览智科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110306681.4/,转载请声明来源钻瓜专利网。