[发明专利]在图像中识别字符区域的方法在审

专利信息
申请号: 201210518153.6 申请日: 2012-12-05
公开(公告)号: CN103034855A 公开(公告)日: 2013-04-10
发明(设计)人: 刘立 申请(专利权)人: 曙光信息产业(北京)有限公司
主分类号: G06K9/20 分类号: G06K9/20
代理公司: 北京德恒律治知识产权代理有限公司 11409 代理人: 章社杲;孙征
地址: 100193 北京*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 图像 识别 字符 区域 方法
【说明书】:

技术领域

发明基本上涉及图像处理领域,更具体地来说,涉及一种在图像中识别字符区域的方法。

背景技术

在如今的计算机应用中,经常需要将视频或者静态图片中的字符信息提取出来,这就在技术实现上提出了更高的要求。

现有技术提供了一种视频字幕提取的方法,包括以下步骤:(1)对视频字幕区域进行基于连通区统计的字幕颜色判断,确认字幕颜色是深色还是浅色,同时反转浅色字幕的灰度图片为深色字幕图片;(2)对步骤(1)获得的灰度图片进行基于局部窗口分析的灰度图片二值化;(3)进行OCR软件识别,提取字幕文本结果。

上述现有技术使用了字幕文字颜色判断和局部阈值的方法,能取得较好的二值化效果,然而,该现有技术通过深色和浅色对于字幕区域进行判断,准确度不高,无法应对较为复杂的识别需要。

发明内容

针对现有技术准确度不高,无法应对较为复杂的识别需要的缺陷,本发明提供了一种在图像中识别字符区域的方法。通过本发明所描述的技术方案,解决了如何更精确地在图像中识别字符区域的技术问题。

本发明提供了一种在图像中识别字符区域的方法,其特征在于,包括:步骤S1:建立所述图像的彩色直方图;以及步骤S2:根据所述彩色直方图上的像素点密度识别所述图像上的字符区域和非字符区域。

优选地,所述步骤S2包括:步骤S21:如果所述彩色直方图上只具有一个像素点聚集区域,则所述像素点聚集区域中的直方图坐标点所表示的颜色是字符颜色;以及步骤S22:将所述图像中的所述字符颜色的区域识别为字符区域,其他区域为非字符区域。

优选地,所述步骤S2包括:步骤S21:如果所述彩色直方图上具有两个像素点聚集区域,则所述两个像素点聚集区域中的第一像素点聚集区域中的直方图坐标点所表示的颜色是字符颜色,所述两个像素点聚集区域中的第二像素点聚集区域中的直方图坐标点所表示的颜色是非字符颜色;以及步骤S22:将所述图像中的所述字符颜色的区域识别为字符区域,并且将所述图像中的所述非字符颜色的区域识别为非字符区域。

优选地,所述第一像素点聚集区域中的像素点多于所述第二像素点聚集区域中的像素点。

优选地,所述像素点聚集区域为像素点密度大于预定密度阈值的区域。

优选地,所述像素点聚集区域为像素点占所述图像中的所有像素点的比例大于预定比例阈值的区域。

优选地,还包括:对所述图像进行二值化处理。

优选地,所述预定比例阈值为20%至30%。

优选地,所述彩色直方图的像素为256*256*256。

通过本发明所提供的在图像中识别字符区域的方法,能够更准确地在图像中识别字符区域,从而能够应对较为复杂的识别需要。

附图说明

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:

图1是根据本发明的实施例的在图像中识别字符区域的方法的总体流程图;

图2是根据本发明的一个具体实施例的在图像中识别字符区域的方法的流程图;

图3是根据本发明的另一个具体实施例的在图像中识别字符区域的方法的流程图。

具体实施方式

以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。

图1是根据本发明的实施例的在图像中识别字符区域的方法的总体流程图。在图1中:

步骤S100:建立图像的彩色直方图。在一个优选实施例中,该彩色直方图的像素为256*256*256。

步骤S102:根据彩色直方图上的像素点密度区分图像上的字符区域和非字符区域。具体来说,彩色直方图中的每个直方图坐标点均代表了一种颜色,而每个直方图坐标点上均标记有数字,这个数字代表了在图像上有多少个像素点的颜色是这个直方图坐标点所表示的颜色。可以通过两种具体方式来实现该步骤,这两种方式将在以下两个具体实施例中示出。

通过本发明所描述的在图像中识别字符区域的方法,能够更准确地在图像中识别字符区域,从而能够应对较为复杂的识别需要。

图2是根据本发明的一个具体实施例的在图像中识别字符区域的方法的流程图。步骤S200和步骤S100相同,在此不再赘述。此外,在图2中还包括以下步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曙光信息产业(北京)有限公司,未经曙光信息产业(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210518153.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top