[发明专利]一种基于定位字符的分类判别强化分离的方法有效
申请号: | 201911253572.X | 申请日: | 2019-12-09 |
公开(公告)号: | CN110956167B | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 田博帆;纪睿哲 | 申请(专利权)人: | 南京红松信息技术有限公司 |
主分类号: | G06V10/22 | 分类号: | G06V10/22;G06V30/14;G06V10/40;G06V30/18;G06V10/764;G06V30/19;G06V30/244 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 顾伯兴 |
地址: | 210022 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 定位 字符 分类 判别 强化 分离 方法 | ||
本发明公开了一种基于定位字符的分类判别强化分离的方法,具体步骤包括:(1)字符定位:通过字符连通域算法或目标识别检测YoLo v3算法对文本图片中的文本字符进行定位处理;(2)字符分类:采用DenseNet网络进行文本字符的多特征提取,并用于文本字符的分类,再对分类后的文本字符进行样本收集和标注;(3)特征提取:根据步骤(2)获得的样本,进行像素级特征提取;(4)强化分离:利用分类器分类得到的重叠混合字符再做强化分离,得到像素级的分类结果,并结合分类器已有的分类结果;直接从步骤(1)中的文本图像中对定位的印刷体字符从像素层面将其灰度值全部设置为白色,实现去除印刷体字符只保留手写体字符。
技术领域
本发明属于文本图像处理技术领域,尤其是涉及一种基于定位字符的分类判别强化分离的方法。
背景技术
随着人工智能信息化时代的发展,图像识别技术逐渐兴起并已深入至各个行业,彻底改变了人类的生产和生活方式。然而技术的不断迭代更新,在传统图像识别领域,原本难以完成的图像处理任务,现阶段可通过人工智能方法实现图像处理的任务需求,弥补传统方法存在的不足。
随着科技的发展,随着人工智能的到来,新的一轮技术革命已然开始;计算机已逐步取代了人工的繁重工作。例如,在文本识别领域,由于大量文本信息待处理,传统的人工审阅方式已然无法满足需求;或者学生考试使用的部分自动批阅系统,以及票据、凭据等的识别录入系统,这些不仅节省了由人工参与而浪费的大量时间,同时提高了工作效率。但作为文本识别系统,对其识别的精度一直以来都有很高的要求,也是目前研究的重点;文本识别主要分为手写体识别和印刷体识别两种,考虑到手写体书写的随意性和复杂性等特点,混合识别变的非常有难度,大多数的识别系统都是将其分开进行识别;伴随智能化识别系统的发展,开始逐渐打破了旧的格局,开辟新的天地;文本识别的前提是先对文本进行定位,实际识别应用中文本大多为印刷体和手写体字符的混合,而手写体通常为识别的重点目标,故需提前对待识别的手写体做出精确定位变得至关重要。
机器视觉发展至今,已取得了辉煌成就。但有关它的研究仍在继续深入,而在当今多元化的社会,随着信息化和智能化技术的逐步展开,开启了一种时代新模式。目前,采用机器视觉技术可以完成各类人工难以实现的复杂任务,为了能够充分利用技术带来的便利,各类产品应运而生。在教育应用领域,存在着众多智能化的批阅产品,这些产品不仅在使用过程中能够增加用户的体验感,同时在行为互动上也增强了用户的参与感。
智能化批阅系统的核心离不开图像中文本字符的识别技术,而识别的前提依赖于强大的学习模型。研究表明,任何一种模型若过于复杂,都将导致其过拟合,使它在预测未知数据时的泛化能力较差。因此,为了提高模型的预测能力,针对复杂情况下的数据识别,模型大多采用分类机制。在图像的文本识别方面,字符种类大致可分为:数字、符号、中文、英文四种,其中除了印刷体字符较为统一规整外,其他的手写体字符则形态万千,因人而异。考虑到手写字符识别的困难性和混合模型学习的复杂性,采取印刷体字符和手写体字符的分类将变得十分必要。
因此,有必要开发一种基于定位字符的分类判别强化分离方法,它采用字符多特征分类的方法并结合其像素级的局部特征进行字符二分类以解决两类字符难以分离的问题,达到字符的强化分离目的。
发明内容
本发明要解决的技术问题是,提供一种基于定位字符的分类判别强化分离方法,它采用字符多特征分类的方法并结合其像素级的局部特征进行字符二分类以解决两类字符难以分离的问题,达到字符的强化分离目的。
为解决上述技术问题,本发明采用的技术方案是:该基于定位字符的分类判别强化分离的方法,具体包括以下步骤:
(1)字符定位:通过字符连通域算法或目标识别检测YoLo v3算法对文本图片中的文本字符进行定位处理,获取所述文本字符的定位坐标;
(2)字符分类:采用DenseNet网络进行文本字符的多特征提取,并用于文本字符的分类,再对分类后的文本字符进行样本收集和标注;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京红松信息技术有限公司,未经南京红松信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911253572.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:电机转子、磁阻电机和电动汽车
- 下一篇:汽车座椅休闲模式调节方法及电子设备