[发明专利]一种复杂背景图像文字分割方法有效

申请号：	201210560199.4	申请日：	2012-12-20
公开（公告）号：	CN102968637A	公开（公告）日：	2013-03-13
发明（设计）人：	柏猛;李敏花;吕英俊	申请（专利权）人：	山东科技大学
主分类号：	G06K9/46	分类号：	G06K9/46;G06K9/62
代理公司：	济南圣达知识产权代理有限公司 37221	代理人：	张勇
地址：	266590 山东省青***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种复杂背景图像文字分割方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种复杂背景图像文字分割方法，其特征是，主要包括以下步骤：进行图像读取；对读取的图像进行文字区域读取；对读取的文字区域进行底层颜色特征抽取；对抽取过底层颜色特征的文字区域进行底层纹理特征抽取；对抽取出来的文字区域的底层颜色特征和底层纹理特征进行融合得到文字区域的底层局部特征；对文字区域的底层局部特征进行粗分类，然后在粗分类的结果上抽取文字区域的标签层全局特征；将文字区域的底层局部特征与文字区域的标签层全局特征进行融合得到文字区域所有像素的特征向量；对文字区域中所有像素特征向量进行训练得到用于第一级文字分割的分类器；用训练好的分类器对图像的特征分类，实现第一级文字分割；对第一级分割的结果进行连通元标定；抽取连通元特征，利用文字连通元与背景连通元的特征差异，进行连通元筛选，去除背景连通元，实现第二级文字分割；输出文字分割结果。

2.如权利要求1所述的一种复杂背景图像文字分割方法，其特征是，具体步骤如下：

步骤（1）：开始，读取图像；

步骤（2）：将图像中的文字区域块提取出来，并将文字块保存到相应位置；

步骤（3）：判断是否所有的文字区域块提取完成，如果提取完成则进入步骤（4）；如果未提取完成返回步骤（2）；

步骤（4）：在RGB颜色空间抽取文字区域块中每个像素点的颜色特征，得到6维局部颜色特征；如果所有像素点的颜色特征抽取完毕就进入步骤（5）；

步骤（5）：抽取文字区域块中每个像素点的纹理特征：首先将文字块转换为灰度图像，然后在灰度图像上抽取Gabor纹理特征，每个像素点得到6维纹理特征；

步骤（6）：将6维颜色特征和6维纹理特征进行特征融合，得到12维图像底层局部特征；

步骤（7）：提取文字区域块的标签层全局特征：将步骤（6）得到的12维图像底层局部特征送入分类器训练，用训练好的分类器分别对文字区域块中的每个像素点进行分类，得到文字区域整体的粗略类别标签分布，计算每个像素点属于文字类和背景类的概率密度，然后抽取每个像素点3×3邻域属于文字类和背景类的概率密度作为标签层全局特征，每个像素点共得到18维标签层全局特征，如果所有的像素点标签层全局特征抽取完毕就进入步骤（8）；

步骤（8）：判断是否所有像素点特征计算是否完成，如果完成则进入步骤（9）；如果未完成则返回步骤（4）；

步骤（9）：将12维图像底层局部特征和18维标签层全局特征进行融合，每个像素点得到一个30维的特征向量；

步骤（10）：利用条件随机场模型对文字块中每个像素点30维特征进行训练，得到用于第一级分割的分类器；

步骤（11）：采用步骤（10）得到的分类器对文字区域中的像素进行分类，将文字区域块中的像素分为文字类和背景类，得到二值化的分割图像，实现文字区域的第一级粗分割；

步骤（12）：对二值化的粗分割图像进行连通元标定，采用4连通标定法；

步骤（13）：对步骤（12）标定好的每个连通元，抽取连通元特征，然后采用阈值分类器删除背景连通元，实现文字区域的第二级分割；

步骤（14）：输出文字分割结果。

3.如权利要求2所述的一种复杂背景图像文字分割方法，其特征是，所述步骤（4）的颜色特征抽取方法为：

首先将图像分解为R、G、B三个颜色通道，对每个像素点抽取相应的R、G、B颜色分量和8邻域像素R、G、B三个分量的均值。

4.如权利要求2所述的一种复杂背景图像文字分割方法，其特征是，所述步骤（5）的Gabor纹理特征的抽取方法是：

在文字区域块的灰度图像上用一组同一频率不同方向不同尺度的Gabor滤波器进行滤波，然后将滤波后的图像按照公式进行合并，其中，i表示尺度，j表示方向，gaborⁱ表示尺度i的合并Gabor滤波图像，表示尺度i方向j上的Gabor滤波图像，然后在滤波后的合并图像上抽取相应的纹理特征，抽取每个像素点3×3邻域Gabor系数的均值和方差作为每个像素点的纹理特征。

5.如权利要求2所述的一种复杂背景图像文字分割方法，其特征是，所述步骤（7）中，标签层全局特征的抽取方法为：采用神经网络对训练文字区域块中的每个像素点进行分类，得到文字区域整体的粗略类别标签分布，计算每个像素点属于文字类和背景类的概率密度，然后抽取该像素点3×3邻域属于文字类和背景类的概率密度作为标签层全局特征。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于山东科技大学，未经山东科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201210560199.4/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种复杂背景图像文字分割方法有效

专利文献下载