[发明专利]文字检测方法、装置、终端及存储介质在审
申请号: | 201810435318.0 | 申请日: | 2018-05-08 |
公开(公告)号: | CN108564084A | 公开(公告)日: | 2018-09-21 |
发明(设计)人: | 王赢绪;刘学博;梁鼎 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 李梅香;张颖玲 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标图像 存储介质 特征数据 文字候选 文字检测 终端 排列方向 特征提取 文本框 | ||
1.一种文字检测方法,其特征在于,包括:
对目标图像进行特征提取处理,得到所述目标图像的特征数据;
根据所述特征数据,得到所述目标图像的多个文字候选框;
对所述多个文字候选框沿着文字的排列方向进行组合,得到至少一个文本框。
2.如权利要求1所述的方法,其特征在于,所述目标图像的特征数据指示下列中的至少一项:
所述目标图像的多个子区域中每个子区域包含文字的概率、所述多个子区域中每个子区域与文字的边界在高度方向上的距离。
3.如权利要求2所述的方法,其特征在于,所述根据所述特征数据,得到所述目标图像的多个文字候选框,包括:
基于所述子区域与文字的边界在高度方向上的距离,对所述子区域在高度方向上进行尺寸调整处理,得到所述文字候选框。
4.如权利要求1至3中任一项所述的方法,其特征在于,所述对所述多个文字候选框沿着文字的排列方向进行组合,得到至少一个文本框,包括:
对所述多个文字候选框进行筛选,得到至少一个目标文字候选框;
对所述至少一个目标文字候选框沿着文字的排列方向进行组合,得到至少一个文本框。
5.如权利要求1至4中任一项所述的方法,其特征在于,所述对所述多个文字候选框沿着文字的排列方向进行组合,得到至少一个文本框,包括:
确定所述多个文字候选框中的第三文字候选框和第四文字候选框的水平距离、以及所述第三文字候选框和所述第四文字候选框在高度方向上的交并比;
在所述水平距离小于预设距离阈值、且所述高度方向上的交并比超过第二比值阈值的情况下,将所述第三文字候选框及所述第四文字候选框进行组合,得到第一子文本框;
将所述第一子文本框与所述多个文字候选框中除所述第三文字候选框及所述第四文字候选框之外的文字候选框进行组合,得到至少一个文本框。
6.如权利要求1至5中任一项所述的方法,其特征在于,所述得到至少一个文本框之后,所述方法还包括:
确定所述至少一个文本框中每个文本框的高度与在文字排列方向上的长度的比值;
基于所述至少一个文本框中每个文本框的高度与在文字排列方向上的长度的比值,对所述至少一个文本框进行过滤,得到至少一个目标文本框。
7.一种文字检测装置,其特征在于,包括:
特征提取单元,用于对目标图像进行特征提取处理,得到所述目标图像的特征数据;
处理单元,用于根据所述特征数据,得到所述目标图像的多个文字候选框;
组合单元,用于对所述多个文字候选框沿着文字的排列方向进行组合,得到至少一个文本框。
8.一种文字检测装置,其特征在于,包括:
存储器,用于存储可执行程序;
处理器,用于执行所述存储器中存储的可执行程序时,实现如权利要求1至6任一项所述的文字检测方法。
9.一种终端,其特征在于,所述终端包括如权利要求7或8所述的文字检测装置。
10.一种存储介质,其特征在于,存储有可执行程序,所述可执行程序被处理器执行时,实现如权利要求1至6任一项所述的文字检测方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810435318.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种遥感图像变化检测方法及装置
- 下一篇:一种自动读取指针式仪表读数的方法