[发明专利]文字检测方法及系统有效
| 申请号: | 201610091568.8 | 申请日: | 2016-02-18 |
| 公开(公告)号: | CN107093172B | 公开(公告)日: | 2020-03-17 |
| 发明(设计)人: | 徐昆;郭晓威;黄飞跃;郑宇飞;张惜今;卢艺帆 | 申请(专利权)人: | 清华大学;腾讯科技(深圳)有限公司 |
| 主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/90 |
| 代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 张振伟;张颖玲 |
| 地址: | 100084*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文字 检测 方法 系统 | ||
1.一种文字检测方法,其特征在于,所述方法包括:
将目标图像的红绿蓝三色通道中每个通道分别做K个等级的量化得到K个等级的区间,K为整数且255>K>1;
将所述目标图像中每个像素在RGB三色通道的亮度映射到对应通道量化的区间中,得到减色图像,以及,将所述目标图像转换为二值图像;
将所述减色图像中具有相同色彩的连通块进行合并,以及将所述二值图像中具有相同色彩的连通块合并;
对所述减色图像三色通道的每种色彩通道的连通块、以及所述二值图像中的连通块,基于连接合并规则依次进行水平方向的合并、竖直方向的合并、以及水平方向的合并,得到所述目标图像中候选的文字区域;其中,所述连接合并规则包括:
满足以下条件至少之一连接选取的两个连通块为新的连通块:
两个所述连通块的包围盒在参考轴向上的中心距离或者边缘距离中的最小距离,小于两个所述连通块的包围盒对应所述参考轴向的边长中最小边长的第一预设比例;两个所述连通块的包围盒在垂直于所述参考轴向的方向上的距离小于两个所述连通块的包围盒在垂直于所述参考轴向的边长中最小边长的第二预设比例;两个所述连通块的包围盒在所述参考轴向的边长的差值小于两个所述连通块的包围盒对应所述参考轴向的边长中最小边长的第三预设比例;
在所述目标图像上对应所述候选的文字区域的位置提取特定区域,基于所提取的所述特定区域中包含文字区域的概率与预设概率阈值的比较结果判断所述提取的特定区域中是否包含文字行或文字列。
2.如权利要求1所述的方法,其特征在于,所述将减色图像中具有相同色彩的连通块进行合并,以及将所述二值图像中具有相同色彩的连通块合并,包括:
对所述减色图像中以及所述二值图像中的每个像素作为一个单独的连通块,建立针对所述像素的并查集执行以下处理:
若所述像素与8邻接的像素中的任一像素的色彩相同,则将相邻的两个色彩相同的像素所属的连通块合并为同一个连通块;
对每个所述连通块的像素面积进行判断,如果所述连通块的像素面积小于像素面积阈值,则将所述连通块并入与所述连通块相邻的连通块,并将所述连通块的色彩设置为所并入的连通块的色彩。
3.如权利要求1所述的方法,其特征在于,所述将所述减色图像中具有相同色彩的连通块进行合并,以及将所述二值图像中具有相同色彩的连通块合并之后,所述方法还包括:
丢弃所述减色图像中以及所述二值图像中符合预设特征的连通块;所述预设特征包括以下至少之一:
所述连通块中面积小于像素面积阈值的连通块;
所述连通块中任意一边长度大于相应图像边长的第一预设比例的连通块;
所述连通块中任意一边长大于边框长度阈值,且像素面积与包围盒积的比值小于比值阈值的连通块。
4.如权利要求1所述的方法,其特征在于,所述将所述减色图像中具有相同色彩的连通块进行合并,以及将所述二值图像中具有相同色彩的连通块合并之后,所述方法还包括:
基于所述减色图像中的每种色彩通道的连通块的位置关系分别进行合并为新的连通块,以及针对所述二值图像中的连通块基于位置关系进行合并为新的连通块;其中,所述合并包括执行以下处理至少之一:
合并距离小于距离阈值的连通块;
取任意两个所述连通块的各自的长宽的平均值的中的最大值,若所述最大值满足预设条件,合并所选取的所述两个连通块;
合并包围盒存在交叉且交叉部分符合预设交叉特征的连通块;
合并包围盒对齐且满足预设对齐合并规则的连通块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;腾讯科技(深圳)有限公司,未经清华大学;腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610091568.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种磨液回收装置
- 下一篇:一种图像雾霾浓度的估计方法





