[发明专利]拒识方法和拒识装置有效
| 申请号: | 201010195920.5 | 申请日: | 2010-06-08 |
| 公开(公告)号: | CN102279927A | 公开(公告)日: | 2011-12-14 |
| 发明(设计)人: | 朱远平;孙俊;堀田悦伸;直井聪;于浩 | 申请(专利权)人: | 富士通株式会社 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 康建峰;陈炜 |
| 地址: | 日本神*** | 国省代码: | 日本;JP |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 方法 装置 | ||
技术领域
本发明一般地涉及字符识别。具体而言,本发明涉及一种基于拒识阈值映射对拒识判决进行优化的拒识方法和拒识装置。
背景技术
在OCR(optical character recognition,光学字符识别)研究中,离线手写字符识别由于其大的类别数目和大量书写风格的变化或者变形而仍然是一个挑战。例如,对于汉字字符识别来说,最常用的字符包括在具有3755个字符的一级国标字符集中。而剩下还有超过几千个汉字不常使用。手写汉字识别的较高准确度,比如接近99%等在实际应用中难以获得。因此,在很多实际应用中,如果可以拒识字符识别装置的不可靠的识别结果而通过人工或者其他方式处理那些识别结果,则剩余部分将具有较高的准确度。总的来说这是一个拒识问题,由此如何作出好的拒识判断是至关重要的。
对于拒识,其目的是获得最低的错误比率同时拒识最少的识别结果。改善字符识别装置的识别能力可以获得更好的拒识,但是这不是这里要讨论的问题。在此,关注于拒识参数的优化,从而能够在不改变当前的识别技术和结果的同时而改善拒识性能。
在过去几年中已经提出了许多拒识策略。例如,J.Pitrelli和M.P.Perrone在“Confidence modeling for verification post-processing forhandwriting recognition,Proceedings of the 8th International Workshopon Frontiers in Handwriting Recognition(IWFHR2002),pp.30-35,2002”中以及R.Bertolami、M.Zimmermann和H.Bunke在“Rejectionstrategies for offline handwritten text line recognition,PatternRecognition Letters,27(16):pp.2005-2012,2006”中提出了几种有效的置信量度方法,从而可以通过置信变换来改善拒识性能。另外,在Xu-ChengYin、Hong-Wei Hao、Yun-Feng Tang、Jun Sun和Satoshi Naoi的“Rejection Strategies with Multiple Classifiers for HandwrittenCharacter Recognition,Proceedings of the 10th International Conferenceon Document Analysis and Recognition(ICDAR2009),pp.1126-1130,2009”中以及在L. P.Cordella、P.Foggia、C.Sansone、F. Tortorella和M.Vento的“Optimizing the Error/Reject Trade-Off for a Multi-ExpertSystem Using the Bayesian Combining Rule,Proceedings of the JointIAPR International Workshops on Advances in Pattern Recognition,LNCS Vol.1451,pp.716-725,1998”中,还将来自多个分类器系统的交叉验证能力用于对拒识性能进行改善。
此外,N.Gorski在“Optimizing error-reject trade off in recognitionsystems,Proceedings of the 4th International Conference on DocumentAnalysis and Recognition(ICDAR1997),pp.1092-1096,1997”中通过训练神经网络分类器来作出拒识判决。
除了上述N.Gorski的方法是基于分类的系统之外,大多数方法使用阈值来判决是否拒识识别结果。这些方法均使用阈值作为通用方式,并且针对所有的样本应用相同的拒识阈值。但是,对于具体样本来说这并不是最优的方式。实际上,单个样本的局部信息可能会对拒识参数的选择产生相当大的影响。
发明内容
有鉴于此,本发明提出了一种新的拒识方法和拒识装置用于光学字符识别,能够基于拒识阈值映射对拒识判决进行优化,从而能够在不改变当前的识别技术和结果的同时达到改善拒识性能的目的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010195920.5/2.html,转载请声明来源钻瓜专利网。





