[发明专利]一种基于边界点笔画形状的字符特征提取方法及应用无效
申请号: | 201210063621.5 | 申请日: | 2012-03-12 |
公开(公告)号: | CN102629322A | 公开(公告)日: | 2012-08-08 |
发明(设计)人: | 汪国有;朱曼瑜;吴红岩;陈明华 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06K9/20 | 分类号: | G06K9/20;G06K9/46 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李佑宏 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 边界 笔画 形状 字符 特征 提取 方法 应用 | ||
1.一种基于边界点笔画形状的字符特征提取方法,包括如下具体步骤:
(一)字符图像的预处理,获得每个字符的正方形字符图像;
(二)对每个字符图像,按如下过程提取字符边界点的笔画形状特征:
(1)定义边界点的笔画形状特征,具体为:
对任一边界点P,计算其在方向i上的字符色像素点数在相应的像素集中所占的比重di,di=li/Sp,i,其中,方向i指以点P为原点作直角坐标系,沿两坐标轴所在直线、沿平分第I、III象限的直线和沿平分第II、IV象限的直线中的任一方向,i=1,2,3或4,li表示i方向上连续字符色像素点的个数,Sp,i表示为过点P作一条沿方向i的直线,落在该直线上的像素点数,则di=[d1,d2,d3,d4]构成的向量即为边界点的4维笔画形状特征,其中,所述边界点指字符图像上,在水平或垂直方向上从背景色跳变为前景色时该前景色所对应的像素点;
(2)沿水平方向和垂直方向分别将单个字符图像平均分为5个水平区域和5个垂直区域;
(3)对各个水平区域在水平方向上进行逐行扫描,获得各水平区域的边界点的笔画形状特征;
(4)对各个垂直区域在垂直方向上进行逐列扫描,获得各垂直区域的边界点的笔画形状特征;
(5)将上述水平和垂直方向上的边界点笔画形状特征合并,获得字符的边界点笔画形状特征。
2.根据权利要求1所述的一种基于边界点笔画形状的字符特征提取方法,其特征在于,所述的步骤(3)中,获得各水平区域的边界点笔画形状特征的具体过程为:
(3.1)对每行像素,在水平方向上,分别从西向东和从东向西两个方向进行扫描,确定各方向上的边界点个数,并分别得到该行像素在每个方向上的笔画形状特征向量,即:如果边界点超过3个,计算前3个边界点的四维笔画形状特征,即组成该行像素的12维笔画形状特征向量;如果少于3个,先计算各边界点的四维笔画形状特征,该行像素12维笔画形状特征向量中的剩余元素用0补齐;
(3.2)根据每一行像素的12维特征向量得到每个区域在从西向东或从东向西方向上的特征矩阵,该特征矩阵的行数等于每个区域内的像素行数;
(3.3)对所述特征矩阵在列方向上求均值,即可得到每个区域在从西向东或从东向西方向上的12维边界点笔画形状特征;
将各区域各方向上的边界点笔画形状特征合并为一维向量,即得到字符在水平方向上的边界点笔画形状特征。
3.根据权利要求1或2所述的一种基于边界点笔画形状的字符特征提取方法,其特征在于,所述的步骤(4)中,获得各垂直区域的边界点笔画形状特征的具体过程为:
(4.1)对每列像素,在垂直方向上,分别从北向南和从南向北两个方向进行扫描,确定各方向的边界点个数,并分别得到该列像素在各个方向上的笔画形状特征向量,即:如果边界点超过3个,计算前3个边界点的四维笔画形状特征,如果少于3个,先计算各边界点的四维笔画形状特征,该行像素12维笔画形状特征向量中的剩余元素用0补齐;
(4.2)根据每一列像素的12维特征得到每个区域在从北向南或从南向北方向上的特征矩阵,该特征矩阵的行数等于每个区域内的像素列数;
(4.3)对该特征矩阵在列方向上求均值,于是得到每个区域在从北向南或从南向北方向上的12维边界点笔画形状特征;
将各区域各方向上的边界点笔画形状特征合并为一维向量,即得到字符在垂直方向上的边界点笔画形状特征。
4.根据权利要求1-3之一所述的一种基于边界点笔画形状特征的字符提取方法,其特征在于,所述步骤(一)中,图像的预处理过程具体为:
首先,将采集到的字符串图像转换为灰度图;
其次,将所述灰度图转换为二值图;
然后,对所述二值图进行切分,将图像中的字符串切分为单个的字符;
最后,对于切分好的每个单个字符,获得其外接矩形,然后进行线性插值,将其大小归一化为长和宽相等的方形图像。
5.一种字符识别方法,具体包括如下步骤:
(1)构建三层结构的BP神经网络,其输入层节点数为240;
(2)利用上述权利要求1-4之一所述的字符特征提取方法提取出样本字符的边界点笔画形状特征,再输入所述BP神经网络进行训练;
(3)提取待识别字符的边界点笔画形状特征,输入上述训练好的BP神经网络,即可进行字符的识别。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210063621.5/1.html,转载请声明来源钻瓜专利网。