[发明专利]一种基于稀疏编码特征的场景文本识别方法有效
申请号: | 201410184072.6 | 申请日: | 2014-05-04 |
公开(公告)号: | CN103942550B | 公开(公告)日: | 2018-11-02 |
发明(设计)人: | 王菡子;王大寒;章冬 | 申请(专利权)人: | 厦门大学 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46 |
代理公司: | 厦门南强之路专利事务所(普通合伙) 35200 | 代理人: | 马应森 |
地址: | 361005 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于稀疏编码特征的场景文本识别方法,涉及计算机视觉和模式识别。输入待识别的自然场景文本图像;采用多尺度滑动窗口的方法,用字符分类器对图像中的窗口区域进行检测和识别,对每一个字符类别,将分类器输出较大的区域判定为候选字符区域,输出较小的区域认为是背景区域,这样找出图像中包含的候选字符区域,再采用非极大值抑制方法,对重叠率较大的区域只保留分类器输出值最大的区域和相应的字符类别,除去重复冗余的候选字符区域,得到字符检测结果;将检测到的字符合并成一个词或文本行;输出场景文本识别结果。能够更加有效地表示和提取字符的结构特征,从而提高场景文本的识别率。 | ||
搜索关键词: | 一种 基于 稀疏 编码 特征 场景 文本 识别 方法 | ||
【主权项】:
1.一种基于稀疏编码特征的场景文本识别方法,其特征在于包括如下步骤:步骤S1:输入待识别的自然场景文本图像;步骤S2:采用多尺度滑动窗口的方法,用字符分类器对图像中的窗口区域进行检测和识别,对每一个字符类别,将分类器输出较大的区域判定为候选字符区域,输出较小的区域认为是背景区域,这样找出图像中包含的候选字符区域,再采用非极大值抑制方法,对重叠率较大的区域只保留分类器输出值最大的区域和相应的字符类别,除去重复冗余的候选字符区域,得到字符检测结果;所述字符分类器的特征提取是采用基于稀疏编码的特征,分类器训练采用训练较为简单且识别速度较快的Random Fern分类器或SVM分类器;所述稀疏编码的特征提取过程包括如下步骤:步骤S201:用大量的自然场景图片数据,用K‑SVD算法学习得到一个具有普遍适用性的稀疏编码字典;所述K‑SVD算法在学习字典时,字典的每个元素设计为9×9的图片,代表了学习得到的共有的结构特征,字典共包含100个元素,即字典的大小为100,这使字典具有较高的表示能力,同时使计算量控制在可接受的范围;步骤S202:将学习得到的稀疏编码字典保存,其中,字典中每个元素描述的是一些重要的结构信息;步骤S203:利用步骤S202中所保存的字典,提取图像的稀疏编码特征;所述提取图像的稀疏编码特征的具体方法为:对图像的每一个像素,通过Orthogonal Matching Pursuit算法进行解码得到像素的稀疏编码,再将得到的稀疏编码进行统计得到稀疏编码的直方图,从而得到图像的稀疏编码特征,即HSC特征;步骤S3:将检测到的字符合并成一个词或文本行;所述将检测到的字符合并成一个词或文本行,由于对每一个字符类别都保留了大量的候选字符区域,将字符合并成词时有大量的组合方式,因此采用动态规划算法搜索得到识别分数最大的字符组合方式,得到最终的文本识别结果;步骤S4:输出场景文本识别结果;所述将得到的稀疏编码进行统计得到稀疏编码的直方图,从而得到图像的稀疏编码特征的方法为:将稀疏编码进行统计得到稀疏编码的直方图时,采用了类似于梯度直方图特征的方法,具体步骤包括:首先,将输入的图片分成8×8的小单元块,统计每一个小单元块的稀疏编码;然后,使用双线性插值法利用每个小单元块的相邻块计算每个小单元块的稀疏编码特征,也即在每个小单元块上的特征是在一个16×16的邻域上求插值得到的;最后,将所有的小单元块的特征向量连起来得到整个图像的稀疏编码特征,即HSC特征;所述采用动态规划算法搜索得到识别分数最大的字符组合方式,需要一个目标函数来评价每一种组合的得分;所述目标函数的设计采用以下方法:用w=(c1,c2,…,cn)表示一个候选词,其中ci(i=1,2,…,n)表示候选词中包含的字符类别,n为字符个数(即文本长度),xi表示ci的候选字符区域,目标函数设计为:
其中S(ci,xi)是字符分类器将候选字符xi识别为ci的得分,g(xi,xi+1)为几何模型的输出,描述了候选字符xi和xi+1在几何关系上的兼容性,α和β是两个调节参数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410184072.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种医疗止血带
- 下一篇:一种颞下颌关节强直截骨髁突保护导板