[其他]字符识别系统在审
| 申请号: | 101986000000220 | 申请日: | 1986-01-16 |
| 公开(公告)号: | CN1003257B | 公开(公告)日: | 1989-02-08 |
| 发明(设计)人: | 加藤真;曾根広尚;高桥弘晏 | 申请(专利权)人: | 国际商业机器公司 |
| 主分类号: | 分类号: | ||
| 代理公司: | 中国专利代理有限公司 | 代理人: | 许新根 |
| 地址: | 美国.纽约*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 字符 识别 系统 | ||
对于每一个输入字符,借助于硬件提取许多不同类型的特征,并把这些特征参数和每个标准字符的特征参数进行比较,从而完成对输入字符的快速分类和鉴别。输入字符和标准字符的特征参数,按其类型进行核对。每类特征参数又含有多维特征分量,同类特征分量依其相应的维数顺序进行比较,以检查其失配程度,在同类型中,相应维的特征分量逐次进行比较并累加其失配度。累加的结果与相对于该类设定的阈值进行比较;当累加的结果超过阈值时,和当前标准字符的比较在此刻停下来,并跳过去和下一个标准字符进行比较。
本发明涉及一种字符识别系统,具体地说,是一种能够对手写字符进行快速分类和鉴别处理的手写字符识别系统。
输入字符的快速分类和鉴别是利用硬件对每个输入字符提取出许多不同类型的特征,并把这些特征和每个标准字符的特征进行比较来实现的。输入字符和标准字符的诸特征是按各种特征类型加以检验的。而各类特征又包含多维特征分量(multidimensional feature components),具有相应维的同类特征分量顺次地进行比较以检验其失配程度。逐次对同类型的相应维的特征分量进行比较,将其失配度即失配值累加起来,并把累加的结果和为该类特征参数确定的阈值进行比较。当累加的结果超过该阈值时,和当前标准字符的比较就在此刻停止,并跳过该字符去和下一个标准字符进行比较。因此,无须比较同类型的全部特征分量,从而提高了分类和鉴别的速度。
标准字符的特征参数根据字符的类别分组,并按字符以字符串的形式存储在词典存储器中,而不属于具体类别的,或者和其他字符组合使用的一个或几个字符,例如无效字符,可定位在多个位置上。因此,被搜索的字符范围能够通过指示词典存储器的检索起始位置和终止位置来规定,把无效字符作为标准字符来对待,使识别过程变得简单。
未经审查的日本专利公告No.201184/83公开了一种手写字符识别系统,该系统采用三种不同类型的特征参数,并按以下三个步骤来识别字符:即,初步分类Ⅰ;初步分类Ⅱ和鉴别阶段。把用字符读入器,例如光学字符阅读器〔OCR〕,读入的输入字符二进制化,规格化和变细。通过扫描变细了的字符图形提取出字符的特征。三种特征参数是:每个方向上字符线的数目;从字符图形轮廓的四边算起的实际字符线的深度以及在每个方向和每个位置上字符线的数目。在初步分类Ⅰ阶段,通过把一输入字符图形中每个方向上的字符线的数目和标准字符图形每个方向上的字符线的数目相比较进行分类。在初步分类Ⅱ阶段,根据字符线的深度进行分类;在鉴别阶段,根据在每个方向和每个位置上的字符线的数目进行鉴别,以选择出一个或几个最终的候选字符。
上述专利申请中所公开的技术,以较简单的算法得到了高的识别精度。但是,总的说来,在识别包括汉字即中国字在内的手写字符的时候,由于有特别大量的字符存在,因此用于分类和鉴别所需要的时间大大超过予处理,例如规格化和变细所需要的时间。在上述专利申请中,第一次缩小识别范围是在初步分类Ⅰ这个步骤实现的;第二次缩小识别范围是在初步分类Ⅱ这个步骤实现的。一个或几个最终候选字符是在最后的步骤-鉴别阶段实现的。因此达到了相当快速的处理。然而由于上述三种特征参数中的每一种都含有多维特征分量,而且在上述专利申请中,因为和相应类型的阈值的比较是在特征分量所有维的误差即失配度总和已经得到的阶段进行的,所以即使仅仅特征分量部分维的失配度总和就超过了该阀值,也不停止进行比较,因此在该现有技术中的这种方法是低效率和不经济的。
而且,还存在一个问题,即:如果仅用软件来处理的话,分类和鉴别处理是缓慢的。虽然,分类和鉴别能用硬件来实施,但需要大规模的硬件配置,且控制系统变得复杂,因为上述三种特征是用分别含有不同的运算的方程来表示的。
为了改善字符识别的精度和提高识别速度,通常用这样的处理方法:根据输入字符的种类,来规定将要用来比较的标准字符图形的范围,而那些规定种类之外的其他字符不再参加比较或被选作候选字符。惯用的字符类型选择处理过程包括:
〔a〕将识别字符类型〔字母、数字和假名等〕的代码标志在标准字符图形上。只有具有规定代码的标准字符图形才被用来进行识别。
〔b〕对OCR文件的每一区域,以字符类型选择表的形式,设立说明所采用字符类型的标志,并参照字符类型选择表,对每一区域确定出用于进行识别的字符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/101986000000220/2.html,转载请声明来源钻瓜专利网。
- 上一篇:桥式座标测量机
- 下一篇:带空气隙的自控可变电抗器
- 同类专利
- 专利分类





