[发明专利]文本框检测方法、装置、电子设备和计算机存储介质在审
申请号: | 202110487577.X | 申请日: | 2021-05-06 |
公开(公告)号: | CN112990201A | 公开(公告)日: | 2021-06-18 |
发明(设计)人: | 秦勇 | 申请(专利权)人: | 北京世纪好未来教育科技有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/20;G06K9/38 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 王姗姗;杨瑾瑾 |
地址: | 100080 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本框 检测 方法 装置 电子设备 计算机 存储 介质 | ||
本申请公开了一种文本框检测方法、装置、电子设备和计算机存储介质。具体实现方案为包括:基于目标图像所对应的文本区域二值图,确定N组角点对的坐标;N为大于等于1的整数;基于所述N组角点对的坐标,从所述目标图像所对应的输入特征中确定N个特征图;将所述N个特征图分别输入第一模型,得到所述第一模型输出的所述N个特征图分别对应的识别结果;基于所述N个特征图分别对应的识别结果,确定所述目标图像中包含的M个目标文本框;M为大于等于1的整数。
技术领域
本申请涉及图像处理领域,尤其涉及一种文本框检测方法、装置、电子设备和计算机存储介质。
背景技术
近年来,随着目标检测在众多领域的应用,使其在计算机视觉领域引起了很大关注,一些基于深度学习的目标检测方法成为焦点,当前,现有的针对文本框检测的方法由于计算量过大或者后处理步骤繁琐,往往存在检测精度较差的问题。
发明内容
为了解决现有技术中上述至少一个问题,本申请实施例提供一种文本框检测方法、装置、电子设备和计算机存储介质。
第一方面,本申请实施例提供一种文本框检测方法,所述方法包括:
基于目标图像所对应的文本区域二值图,确定N组角点对的坐标;N为大于等于1的整数;
基于所述N组角点对的坐标,从所述目标图像所对应的输入特征中确定N个特征图;
将所述N个特征图分别输入第一模型,得到所述第一模型输出的所述N个特征图分别对应的识别结果;
基于所述N个特征图分别对应的识别结果,确定所述目标图像中包含的M个目标文本框;M为大于等于1的整数。
第二方面,本申请实施例提供一种文本框检测装置,所述装置包括:
第一检测单元,用于基于目标图像所对应的文本区域二值图,确定N组角点对的坐标;N为大于等于1的整数;
第二检测单元,用于基于所述N组角点对的坐标,从所述目标图像所对应的输入特征中确定N个特征图;
识别单元,用于将所述N个特征图分别输入第一模型,得到所述第一模型输出的所述N个特征图分别对应的识别结果;
文本框确定单元,用于基于所述N个特征图分别对应的识别结果,确定所述目标图像中包含的M个目标文本框;M为大于等于1的整数。
第三方面,本申请实施例提供一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请任意一项实施例所提供的方法。
第四方面,本申请实施例提供一种存储有计算机指令的非瞬时计算机可读存储介质,所述计算机指令用于使所述计算机执行本申请任意一项实施例所提供的方法。
上述申请中的一个实施例具有如下优点或有益效果:通过基于目标图像所对应的文本区域二值图,确定多组角点对的坐标,基于多组角点对的坐标,从目标图像所对应的输入特征中确定多个特征图。如此,可以将多个特征图分别输入第一模型得到分别对应的识别结果,进而根据每一个特征图所对应的识别结果确定目标图像中包含的目标文本框,从而能够从很多角点对所框出来的候选特征图中确定真实的目标文本框,提升了从图像中检测得到真实文本框的精度。
上述可选方式所具有的其他效果将在下文中结合具体实施例加以说明。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是根据本申请实施例的文本框检测方法流程示意图一;
图2是根据本申请实施例的文本框检测方法流程示意图二;
图3是根据本申请实施例的文本框检测方法流程示意图三;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京世纪好未来教育科技有限公司,未经北京世纪好未来教育科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110487577.X/2.html,转载请声明来源钻瓜专利网。