[发明专利]手写笔体自动识别系统和方法无效
| 申请号: | 201110360441.9 | 申请日: | 2011-11-15 |
| 公开(公告)号: | CN102541347A | 公开(公告)日: | 2012-07-04 |
| 发明(设计)人: | 薛雷;何金胜;袁苑;何星剑;张丽 | 申请(专利权)人: | 上海大学 |
| 主分类号: | G06F3/041 | 分类号: | G06F3/041;G06K9/60 |
| 代理公司: | 上海上大专利事务所(普通合伙) 31205 | 代理人: | 何文欣 |
| 地址: | 200444*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 手写 笔体 自动识别 系统 方法 | ||
1.一种手写笔体自动识别系统,包括一块由Intel? Atom Z510P芯片主控制作的EMB-4650主板(1),其特征在于所述主板(1)扩展的子接口有LVDS接口、DVI接口、USB接口和COM接口;这些接口分别与一个AUO显示屏(2)、一个DVI-LVDS信号转换板(3)、一个USB控制器(4)和GSM模块(5)相连接;由此DVI-LVDS信号转换板(3)与另一个AUO显示屏(6)相连接,USB控制器(4)与触摸屏(7)相连接;当用户在触摸屏上写入数据时,这些数据通过USB控制器传送到EMB-4650主板,同时EMB-4650主板把数据传送到显示屏,实现实时显示;同时EMB-4650主板对这些数据进行识别算法处理,然后把处理后的结果送到显示屏显示,达到简易的人机互动实时操作效果;编辑好的字体数据可通过COM口发送到GSM模块,实现数据的实时发送。
2.一种手写笔体自动识别方法,采用权利要求书1所述的手写笔体自动识别系统进行识别,其特征在于具体操作步骤如下:
步骤1:笔体数据的输入:当触摸屏被触摸时,触摸屏把这些数据以图像数据的形式存储起来,供主机读取;
步骤2:笔体数据的预处理:主板1从触摸屏(7)读入已存的图像数据,输入到主板(1)寄存器中;
步骤2-1:把触摸屏(7)输入的数据256色位图按照灰度映射表方法转灰度图;
步骤2-2:二值化:采用硬阈值的方式对灰度图实现二值化;
步骤2-3:去离散噪声:对触摸混入的噪声进行去噪处理;
步骤2-4:梯度锐化:采用微分法进行图像锐化处理:
设图像为 ,定义在点处的梯度矢量为:
,梯度有两个重要性质:梯度的方向在函数最大变化率方向上和梯度的幅度用表示,且其值为:
由此式得结论:梯度的数值是在其最大变化率方向上的单位距离所增加的量;
对于离散的数字图像,上式改写成:
为了计算方便,也可以采用下面的近似计算公式(1):
如果直接采用梯度值来表示图像,即令=,则有上述公式(1)可见:在图像变换缓慢的地方其值很小(对应于图像较暗);而在线条轮廓等变换较快的地方的值很大;图像在经过梯度运算后变得清晰从而达到锐化的目的;
对于图像变换缓慢的地方梯度很小而导致图像较暗这一不利因素,解决方法是给一个阈值,如果小于该阈值,则保持原灰度值不变;如果大于或等于阈值,则赋值为:
步骤2-5:细化:指求一副图像中央骨骼部分过程,中央骨骼部分是描述图像几何及拓扑性质的重要特征之一,对被处理的图像进行细化有助于突出形状特点和减少冗余信息量;
采用的细化算法具有的特性:一幅图像中的一个区域,对各点标记名称P1,P2,…P8,其中P1位于中心;如果P1=1,即黑点,下面4个条件如果同时满足,则删除P1(P1=0);①2NZ(P1)6;②=1;③P2*P4*P8=0或者1;④P2*P4*P6=0或者1;对于图像中的每一个点重复这一步骤,直到所有的点都不可删除为止;
步骤3:笔体数据的形状特征提取:手写体汉字的形状特征包括倾斜度、重心偏移、字符伸展,这种特征用矩来描述;
对于一幅的字符图像,其p+q阶矩定义为:
其中,,各阶矩的物理意义说明如下:表示图像在水平方向上的伸展度;表示图像在垂直方向上的伸展度;表示图像的倾斜度>0表示图像向左上倾斜,<0表示图像向右上倾斜;表示图像在水平方向上的重心偏移度>0表示重心偏左,<0表示重心偏右;表示图像在垂直方向上的重心偏移度>0表示重心偏上,<0表示重心偏下;表示图像水平伸展的均衡程度,>0表示图像下部的水平伸展度比图像上部大,<0表示图像下部的水平伸展度比图像上部小;表示图像垂直伸展的均衡程度,>0表示图像右部的垂直伸展度比图像左部大,<0表示图像右部的垂直伸展度比图像左部小;
由上面计算出的中心矩导出以下的一些归一化的形状特征:
长宽比:
字形倾斜度:;其中
拉长度:;其中的计算式如下:
伸展度:;其中size表示字符点阵的大小,即
三阶的中心矩由于其值可能为正或为负,实际上,它们都是由基函数为正和为负的两部分所组成的;
通过三阶中心矩提取的归一化特征如下:
①水平偏移度:
②垂直偏移度:
③水平伸展均衡度:
④垂直伸展均衡度:
对于对应的特征字,求出它们的特征矢量,定义的距离如下:
;其中r为:
步骤4:笔体数据识别:以文字质心为原点、归一化后的文字高度的一半为半径,建立极坐标系,对整个圆周进行扇形平均分块,块数n可变;
最终判断两幅位图是否相似即当前所写的汉字与以往保存的笔记中出现过的字是否具有一定程度上的相似性遵循同一条准则:只有当两幅位图相对应的n块区域内每块区域像素点的总数的两两差值均小于预先设置的阈值时,才将二者视为相似;而将n定格为可变等效于将查找的精度设置为可调;
显然,n=12时我们认为查找被视作模糊查找,而n=360时则认为是精确查找;在完成字体数据识别之后,计算机把识别到的字体在屏幕上显示出来。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110360441.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:抗冲击石材幕墙
- 下一篇:开关磁阻电机的转矩平滑控制方法





