[发明专利]文字检测方法及系统有效
| 申请号: | 201610091568.8 | 申请日: | 2016-02-18 |
| 公开(公告)号: | CN107093172B | 公开(公告)日: | 2020-03-17 |
| 发明(设计)人: | 徐昆;郭晓威;黄飞跃;郑宇飞;张惜今;卢艺帆 | 申请(专利权)人: | 清华大学;腾讯科技(深圳)有限公司 |
| 主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/90 |
| 代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 张振伟;张颖玲 |
| 地址: | 100084*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文字 检测 方法 系统 | ||
本发明公开了一种文字检测方法及系统;方法包括:将目标图像的三色通道中的每个图像进行减色处理,得到减色图像,以及,将目标图像转换为二值图像;将减色图像中具有相同色彩的连通块进行合并,以及将二值图像中具有相同色彩的连通块合并;对减色图像三色通道的每种色彩通道的连通块、以及二值图像中的连通块,分别在竖直和水平方向上以连接的方式进行合并,得到目标图像中候选的文字区域;在目标图像上对应候选的文字区域的位置提取特定区域,基于所提取的特定区域中包含文字区域的概率与预设概率阈值的比较结果判断提取的特定区域中是否包含文字行或文字列。实施本发明,能够对图像中的文本进行准确检测。
技术领域
本发明涉及图像中的文字检测技术,尤其涉及一种文字检测方法及系统。
背景技术
文档图像即图像格式的文档,它是通过某种方式(如扫描)将纸质文档等转化为图像格式的文档,以供用户电子阅读,文档图像的典型示例是便携式文档格式(PDF,PortableDocument Format)格式图像、以及DjVu格式图像。
目前的文字检测技术可以对文档图像中的文字进行检测(定位图像中承载文字的区域),并基于检测到的承载文字的区域进行文字识别。
一般意义上的图像不仅包括文档图像,还包括非文档图像(也就是通过扫描格式图像如网络相册中的用户上传图像,这些图像可能是联合照片专家组(JPG)图像、位图(BMP)图像、标签图像文件格式(TIFF)图像、图形交换格式(GIF)图像以及可交换的图像文件格式(EXIF)图像等。
如果能识别非文档格式图像中的文字,则可以获得准确的语义信息,帮助用户检索、管理图像。要想识别非扫描格式图像中的文字,检测图像中的文字是必要的前置步骤,目前的文字检测技术多使用人工指定的特征来判别图像是否中是否包含有文字,且多针对英文字符进行检测,由于中文与英文在字形结构上存在显著的差异,应用于文档图像中的中文检测时住准确度与文档图像中检测英文的精度存在较大差异,难以满足实际应用的需求。
发明内容
本发明实施例提供一种文字检测方法及系统,能够对图像中的文本进行准确检测。
本发明实施例的技术方案是这样实现的:。
第一方面,本发明实施例提供一种文字检测方法,所述方法包括:
将目标图像的三色通道中的每个图像进行减色处理,得到减色图像,以及,将所述目标图像转换为二值图像;
将所述减色图像中具有相同色彩的连通块进行合并,以及将所述二值图像中具有相同色彩的连通块合并;
对所述减色图像三色通道的每种色彩通道的连通块、以及所述二值图像中的连通块,分别在竖直和水平方向上以连接的方式进行合并,得到所述目标图像中候选的文字区域;
在所述目标图像上对应所述候选的文字区域的位置提取特定区域,基于所提取的所述特定区域中包含文字区域的概率与预设概率阈值的比较结果判断所述提取的特定区域中是否包含文字行或文字列。
优选地,所述将目标图像的三色通道中的每个图像进行减色处理,得到减色图像,包括:
将所述目标图像的红绿蓝三色通道中每个通道分别做K个等级的量化得到K个等级的区间;
将所述目标图像中每个像素在RGB三色通道的亮度映射到对应通道量化的区间中,K为整数且255>K>1。
优选地,所述将减色图像中具有相同色彩的连通块进行合并,以及将所述二值图像中具有相同色彩的连通块合并,包括:
对所述减色图像中以及所述二值图像中的每个像素作为一个单独的连通块,建立针对所述像素的并查集执行以下处理:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学;腾讯科技(深圳)有限公司,未经清华大学;腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610091568.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种磨液回收装置
- 下一篇:一种图像雾霾浓度的估计方法





