[发明专利]一种复杂背景图像文字分割方法有效

专利信息
申请号: 201210560199.4 申请日: 2012-12-20
公开(公告)号: CN102968637A 公开(公告)日: 2013-03-13
发明(设计)人: 柏猛;李敏花;吕英俊 申请(专利权)人: 山东科技大学
主分类号: G06K9/46 分类号: G06K9/46;G06K9/62
代理公司: 济南圣达知识产权代理有限公司 37221 代理人: 张勇
地址: 266590 山东省青*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 复杂 背景 图像 文字 分割 方法
【权利要求书】:

1.一种复杂背景图像文字分割方法,其特征是,主要包括以下步骤:进行图像读取;对读取的图像进行文字区域读取;对读取的文字区域进行底层颜色特征抽取;对抽取过底层颜色特征的文字区域进行底层纹理特征抽取;对抽取出来的文字区域的底层颜色特征和底层纹理特征进行融合得到文字区域的底层局部特征;对文字区域的底层局部特征进行粗分类,然后在粗分类的结果上抽取文字区域的标签层全局特征;将文字区域的底层局部特征与文字区域的标签层全局特征进行融合得到文字区域所有像素的特征向量;对文字区域中所有像素特征向量进行训练得到用于第一级文字分割的分类器;用训练好的分类器对图像的特征分类,实现第一级文字分割;对第一级分割的结果进行连通元标定;抽取连通元特征,利用文字连通元与背景连通元的特征差异,进行连通元筛选,去除背景连通元,实现第二级文字分割;输出文字分割结果。

2.如权利要求1所述的一种复杂背景图像文字分割方法,其特征是,具体步骤如下:

步骤(1):开始,读取图像;

步骤(2):将图像中的文字区域块提取出来,并将文字块保存到相应位置;

步骤(3):判断是否所有的文字区域块提取完成,如果提取完成则进入步骤(4);如果未提取完成返回步骤(2);

步骤(4):在RGB颜色空间抽取文字区域块中每个像素点的颜色特征,得到6维局部颜色特征;如果所有像素点的颜色特征抽取完毕就进入步骤(5);

步骤(5):抽取文字区域块中每个像素点的纹理特征:首先将文字块转换为灰度图像,然后在灰度图像上抽取Gabor纹理特征,每个像素点得到6维纹理特征;

步骤(6):将6维颜色特征和6维纹理特征进行特征融合,得到12维图像底层局部特征;

步骤(7):提取文字区域块的标签层全局特征:将步骤(6)得到的12维图像底层局部特征送入分类器训练,用训练好的分类器分别对文字区域块中的每个像素点进行分类,得到文字区域整体的粗略类别标签分布,计算每个像素点属于文字类和背景类的概率密度,然后抽取每个像素点3×3邻域属于文字类和背景类的概率密度作为标签层全局特征,每个像素点共得到18维标签层全局特征,如果所有的像素点标签层全局特征抽取完毕就进入步骤(8);

步骤(8):判断是否所有像素点特征计算是否完成,如果完成则进入步骤(9);如果未完成则返回步骤(4);

步骤(9):将12维图像底层局部特征和18维标签层全局特征进行融合,每个像素点得到一个30维的特征向量;

步骤(10):利用条件随机场模型对文字块中每个像素点30维特征进行训练,得到用于第一级分割的分类器;

步骤(11):采用步骤(10)得到的分类器对文字区域中的像素进行分类,将文字区域块中的像素分为文字类和背景类,得到二值化的分割图像,实现文字区域的第一级粗分割;

步骤(12):对二值化的粗分割图像进行连通元标定,采用4连通标定法;

步骤(13):对步骤(12)标定好的每个连通元,抽取连通元特征,然后采用阈值分类器删除背景连通元,实现文字区域的第二级分割;

步骤(14):输出文字分割结果。

3.如权利要求2所述的一种复杂背景图像文字分割方法,其特征是,所述步骤(4)的颜色特征抽取方法为:

首先将图像分解为R、G、B三个颜色通道,对每个像素点抽取相应的R、G、B颜色分量和8邻域像素R、G、B三个分量的均值。

4.如权利要求2所述的一种复杂背景图像文字分割方法,其特征是,所述步骤(5)的Gabor纹理特征的抽取方法是:

在文字区域块的灰度图像上用一组同一频率不同方向不同尺度的Gabor滤波器进行滤波,然后将滤波后的图像按照公式进行合并,其中,i表示尺度,j表示方向,gabori表示尺度i的合并Gabor滤波图像,表示尺度i方向j上的Gabor滤波图像,然后在滤波后的合并图像上抽取相应的纹理特征,抽取每个像素点3×3邻域Gabor系数的均值和方差作为每个像素点的纹理特征。

5.如权利要求2所述的一种复杂背景图像文字分割方法,其特征是,所述步骤(7)中,标签层全局特征的抽取方法为:采用神经网络对训练文字区域块中的每个像素点进行分类,得到文字区域整体的粗略类别标签分布,计算每个像素点属于文字类和背景类的概率密度,然后抽取该像素点3×3邻域属于文字类和背景类的概率密度作为标签层全局特征。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东科技大学,未经山东科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210560199.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top