[发明专利]一种基于交互平台的复杂背景中文本的快速检测方法有效
申请号: | 201510801295.7 | 申请日: | 2015-11-19 |
公开(公告)号: | CN105404868B | 公开(公告)日: | 2019-05-10 |
发明(设计)人: | 程洪;王光甫;杨路 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 成都金英专利代理事务所(普通合伙) 51218 | 代理人: | 袁英 |
地址: | 610041 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 交互 平台 复杂 背景 文本 快速 检测 方法 | ||
1.一种基于交互平台的复杂背景中文本的快速检测方法,其特征在于:它包括以下步骤:
S1:输入图像预处理:对输入的图像进行预处理操作,增强文本边缘对比度;
S2:文本候选区域快速定位:对步骤S1预处理后的图像作轮廓检测,并用矩形框将每个闭合区域框选出来,然后通过SIFT算法快速定位每个矩形框中的所有角点,将角点个数作为初步筛选条件进行初步筛选;
S3:候选区域归一化:通过归一化算法首先将图像调整到统一的大小,再通过前向映射的方法将原图像中的内容投射到归一化后的图片的正中心,并适当的修正角度;
S4:文本/背景筛选:首先离线的根据训练样本提取具有鲁棒性的特征,经过训练后的分类器筛选后的候选区域为检测出的文本区域。
2.根据权利要求1所述的一种基于交互平台的复杂背景中文本的快速检测方法,其特征在于:所述的步骤S1包括以下子步骤:
S11:将输入的图像进行直方图均值化,使得原始图像的灰度直方图从比较集中的某个灰度区间变成在全部灰度范围的均匀分布,公式如下:
式中,n为图像的像素总和,k是当前灰度级像素的个数,L是图像中可能出现的像素灰度级的总数;
S12:采用图像锐化算法对图像进行加强:采用Kirsch算子模板对图像上的每一个像素点进行卷积求导数,所述的Kirsch算子模板的数量N代表方向的数量,对图像上的N个特点边缘方向做出最大响应,运算中取最大值作为图像的边缘输出。
3.根据权利要求1所述的一种基于交互平台的复杂背景中文本的快速检测方法,其特征在于:所述的步骤S2包括以下子步骤:
S21:对步骤S1预处理后的图像作轮廓检测,并用矩形框将每个闭合区域框选出来;
S22:通过SIFT算法快速定位每个矩形框中的所有角点;
S23:统计落在每个矩形框中的角点个数,公式如下:
式中,k代表第k个矩形框区域,w和h分别代表所述矩形框区域的宽和长,p(x,y)代表矩形框的二值图像,s(x,y)代表矩形框对应的SIFT角点图;
S24:用单位面积的角点个数作为初步筛选条件,公式如下:
当PRNk的值大于某个值时,认为该区域含有文本。
4.根据权利要求1所述的一种基于交互平台的复杂背景中文本的快速检测方法,其特征在于:所述的步骤S3包括以下子步骤:
S31:采用Moment算法求出原图像中内容的形心,公式如下:
mpq=∑x∑yxpyqf(x,y);
式中,x和y分别代表图像中(x,y)像素的坐标,f(x,y)代表在(x,y)点的像素值;p和q代表阶数;mpq代表Moment算子;xc和yc分别代表原矩形框内的内容形心的坐标值;
S32:计算矩形框中内容的倾斜角度θ,公式如下:
μpq=ΣxΣy(x-xc)(y-yc)f(x,y);
tanθ=μ11/μ02;
S33:经过前向映射后得到新图像,公式如下:
式中,x'c和y'c分别代表归一化图长宽的一半,(x',y')代表改变大小后的图像的中心,α和β代表映射比例。
5.根据权利要求1所述的一种基于交互平台的复杂背景中文本的快速检测方法,其特征在于:
步骤S4中所述的特征包括方向梯度直方图特征、文本的起/终点与交叉点个数、几何特征、轮廓的梯度均值;所述的几何特征包括:矩形框面积、非0像素点个数、轮廓周长。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510801295.7/1.html,转载请声明来源钻瓜专利网。