[发明专利]提取图像文字区域的方法和装置有效

专利信息
申请号: 201711174268.7 申请日: 2017-11-22
公开(公告)号: CN108205676B 公开(公告)日: 2019-06-07
发明(设计)人: 苏睿;燕志伟 申请(专利权)人: 西安万像电子科技有限公司
主分类号: G06K9/34 分类号: G06K9/34;G06K9/20
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 赵囡囡
地址: 710075 陕西省西安*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 文字区域 文字像素 宏块 像素 待处理图像 方法和装置 提取图像 灰度 过程效率 灰度颜色 建模过程 中文字 分块 拼接 抽取 查找
【说明书】:

发明公开了一种提取图像文字区域的方法和装置。其中,该方法包括:将待处理图像进行分块,得到多个宏块;对宏块中每个像素的颜色值进行灰度颜色变换,得到每个像素的灰度值;根据每个像素的灰度值查找宏块中的文字像素;抽取文字像素,并对文字像素进行拼接,得到待处理图像的文字区域。本发明解决了现有技术中文字区域的识别需要复杂的建模过程,导致识别过程效率低的技术问题。

技术领域

本发明涉及图像处理领域,具体而言,涉及一种提取图像文字区域的方法和装置。

背景技术

在计算机数字图像处理领域,图像中的文字是一种重要的图像内容。自动提取和识别图像中的文字,会极大地协助计算机对图像进行分类、索引,且有助于图像后期的处理,如压缩或OCR识别。

目前图像文字分割技术大体可分为三类:基于颜色阈值的连通域方法,基于统计模型方法和基于聚类的方法。

1、基于颜色阈值的方法,其通常会将全帧图像做全局阈值或局部阈值处理,使其变成一个二值图像,然后再利用空间相关性,将那些连通在一起的像素点所构成的区域所覆盖的像素标记为文字像素,从而达到将文字从背景中提取出来的目的。此方法的缺点是,如果图像中文字的背景比较复杂,且文字颜色与背景相似,则全局阈值或局部阈值的选择都会变得非常困难,导致该方法无法使用。

2、基于统计模型的方法,此方法会将文字块内所有的像素建立概率模型,通常可以是高斯混合模型,然后通过概率模型参数确定每个区域的像素是否属于文字块像素。由于概率模型的假设条件对于自然界产生的图像较为适用,所以分割自然物体效果较好。但是对于人工图像(例如:印刷体文字),此高斯概率模型很难成立,所以应用于人工图像中的文字分割效果较差。

3、基于聚类的方法,此方法通过将一帧图像的像素分为M类,文字像素对应于其中一类。通过支持向量积或主成分分析方法,将一个低维度空间问题转换为一个高维度空间问题。在高维空间分类后,再映射回其原始空间。此种方法需要选择合适的核函数且要建立复杂的数学模型,计算复杂度高,实际应用受限。同时,如果背景中出现大量与文字相近的颜色时,会将背景像素归入为文字块像素,也会产生较高的误判率。

上述集中文字分割方法均从全局图像的像素数据来分割文字,不仅会干扰到局部的文字像素判断与标识,同时复杂的数学模型的方法给实际应用带来很大的局限性。

针对现有技术中文字区域的识别需要复杂的建模过程,导致识别过程效率低的问题,目前尚未提出有效的解决方案。

发明内容

本发明实施例提供了一种提取图像文字区域的方法和装置,以至少解决现有技术中文字区域的识别需要复杂的建模过程,导致识别过程效率低的技术问题。

根据本发明实施例的一个方面,提供了一种提取图像文字区域的方法,包括:将待处理图像进行分块,得到多个宏块;对宏块中每个像素的颜色值进行灰度颜色变换,得到每个像素的灰度值;根据每个像素的灰度值查找宏块中的文字像素;抽取文字像素,并对文字像素进行拼接,得到待处理图像的文字区域。

进一步地,获取每个像素的颜色值,其中,颜色值包括三个颜色通道的颜色数据;确定三个颜色通道的颜色数据的均值为灰度值。

进一步地,根据宏块中每个像素的灰度值确定宏块中出现频率最多的灰度值为第一主颜色;确定具有第一主颜色的第一类像素为文字像素。

进一步地,将第一类像素的数量占宏块中像素数量的比例与预设比例进行比对;在第一类像素的数量占宏块中像素数量的比例大于或等于预设比例的情况下,停止继续查找文字像素;在第一类像素的数量占宏块中像素数量的比例小于预设比例的情况下,在宏块中继续查找文字像素。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安万像电子科技有限公司,未经西安万像电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711174268.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top