[发明专利]基于全卷积神经网络的中文字符图像笔划提取方法、系统有效
申请号: | 201910454930.7 | 申请日: | 2019-05-29 |
公开(公告)号: | CN110232337B | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 刘成林;王铁强 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 卷积 神经网络 中文 字符 图像 笔划 提取 方法 系统 | ||
本发明属于计算机视觉及模式识别领域,具体涉及了一种基于全卷积神经网络的中文字符图像笔划提取方法、系统,旨在解决自由书写的手写字符笔划提取困难的问题。本发明方法包括:对获取的中文字符图像进行区域提取;对交叠区域、非交叠区域进行骨架化操作;计算骨架化后的交叠区域任意笔划段之间的连贯度;将交叠区域中属于同一笔划的笔划段相连,与非交叠区域中直接相连的笔划段合并成完整的骨架形态笔划。本发明一方面在自由书写的手写中文字符笔划重叠的情况下,依然可以实现手写中文字符的笔划提取,另一方面采用了字符合成方法获取训练样本,并附带其在不同任务中的不同标注信息,极大地节约了人力成本。
技术领域
本发明属于计算机视觉及模式识别领域,具体涉及了一种基于全卷积神经网络的中文字符图像笔划提取方法、系统。
背景技术
中文字符图像的笔划提取在基于结构分析的文字识别研究和相关应用中具有重要地位。基于深度学习技术的中文手写/印刷字符的单字分类已经取得了相当高的正确率,但是,在很多应用中,人们不仅关心字符的类别,还关注笔划解释、书写质量评价、形状美化、字体设计等问题,而这就需要对文字图像中的笔划进行分割和提取。
对于脱机中文字符的笔划提取问题,过去已有算法主要有两类:直接提取法和基于字符骨架的提取方法。其中,直接提取的方法主要用于印刷体字符,在字符图像具备平滑的边缘、简单的笔划形状、固定的笔划宽度和清晰的笔划间关系时,这一类方法的效果较好,例如Tseng和Chuang等研究者[1]从多种印刷字体的字符结构中总结出一些通用性的规律,通过启发式规则来进行笔划提取;Cao和Tan等[2]将印刷字符按照类似的规律切分为笔划段(共计3种类型),之后再将这些笔划段筛选、重组为独立笔划;Lee和Wu[3]将印刷字符图像表示为图(Graph)的形式,并在笔划的交叠区域根据轮廓特征来推断笔划段间的连接关系;Chen等人[4]则从标准字体中学习出二维流形,再用与流形对应的模板字符(其中笔划已提取完毕)来指导真实印刷样本的笔划提取。当处理脱机手写字符图像时,由于自由手写字符在笔划形状和笔划间关系上具有较高的多样性和复杂性,利用启发式规则直接提取笔划很难达到理想的效果。因此,现有的大部分对于脱机手写字符进行笔划提取的工作都是在字符骨架上进行操作的,这种操作把连通区域级上的笔划提取任务简化为线条级别上的提取[5]。在字符骨架上进行笔划提取时,已有的大部分方法所采用的规则与直接提取法中的相关部分是类似的。基于骨架化的笔划提取面临骨架扭曲(尤其是笔划交叠区域)、笔划段连接歧义的问题,至今尚没有很好地解决方法。
总的来说,虽然研究者们提出了很多关于中文印刷/手写字符图像中笔划提取的方法,但是主要关注的还是比较规范的字符。对于自由书写的手写字符,由于笔划形态和位置多变,加上笔划重叠区域的情况非常复杂,给笔划提取带来了巨大的挑战,现有方法尚未给出令人满意的结果。
以下文献是与本发明相关的技术背景资料:
[1]Lin Yu Tseng and Chen-Tsun Chuang.An efficient knowledge-basedstroke extraction method for multi-font Chinese characters.PatternRecognition,25(12):1445-1458,1992.
[2]Ruini Cao and Chew Lim Tan.A model of stroke extraction fromChinese character images.In.Proceedings of the 15th International Conferenceon Pattern Recognition,2000.
[3]Chungnan Lee and Bohom Wu.A Chinese-character-stroke-extractionalgorithm based on contour information.Pattern Recognition,31(6):651-663,1998.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910454930.7/2.html,转载请声明来源钻瓜专利网。