[发明专利]基于条件对抗网络的字帖二值化背景噪声杂点去除方法有效
申请号: | 201810533526.4 | 申请日: | 2018-05-29 |
公开(公告)号: | CN108805833B | 公开(公告)日: | 2019-06-18 |
发明(设计)人: | 张九龙;郭铭涛;屈小娥 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 许志蛟 |
地址: | 710048*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 字帖 去除 背景噪声 二值化 基于条件 训练数据 辨别器 生成器 取样 去噪 样本 数字化操作 数字化平台 分类识别 历史原因 人工噪声 数据样本 对抗 数据集 有效地 噪声 字体 切割 网络 美化 更新 展览 制作 | ||
本发明公开的基于条件对抗网络的字帖二值化背景噪声杂点去除方法,包括以下步骤:步骤1,建立取样样本;步骤2,根据步骤1中的取样样本,制作人工噪声数据集,得到最终训练数据;步骤3,将步骤2中得到的最终训练数据进行训练,依次更新辨别器和生成器;步骤4,将待处理的字帖数据样本带入步骤3的辨别器和生成器中进行去噪,得到去除噪声杂点后的字帖。本发明字帖二值化背景噪声杂点去除方法对于文献由于历史原因和数字化操作不当所造成的背景杂点,能够有效地去除杂点,对于数字化平台展览提供一个去噪的操作,美化字体图;同时提高分类识别率和切割精度,有很好的使用价值。
技术领域
本发明属于图像处理方法技术领域,具体涉及一种基于条件对抗网络的字帖二值化背景噪声杂点去除方法。
背景技术
通过我国传统文化保护战略的引导,现在越来越多的古文书籍、碑帖、藏经等通过数字化手段保存下来,数字化以后这些资料具有很高的研究价值,但是很多资料在数字化的过程中,由于年代过于久远,出现了很多背景杂点,严重影响了古文的美观度以及后续的研究工作。比如在古文字体分类过程中,字体背景杂点的存在严重影响了古文字体的分类识别率;在字体切割过程中,这些背景杂点对于切割的精度也造成了很大的影响;在数字化平台展览过程中,这些背景杂点的存在,使得作品的美观度大打折扣。
鉴于以上种种原因,如何精准去除杂点,去除的同时又能够保护原有字体细节不受损害,成为当下急需解决的一个问题。
发明内容
本发明的目的是提供一种基于条件对抗网络的字帖二值化背景噪声杂点去除方法,解决了现有字帖数字化过程中,由于背景杂点使分类识别率、切割精度降低的问题。
本发明所采用的技术方案是,基于条件对抗网络的字帖二值化背景噪声杂点去除方法,包括以下步骤:
步骤1,建立取样样本;
步骤2,根据步骤1中的取样样本,制作人工噪声数据集,得到最终训练数据;
步骤3,将步骤2中得到的最终训练数据进行训练,依次更新辨别器权重和生成器权重;
步骤4,将待处理的字帖数据样本带入经步骤3更新的辨别器和生成器中进行去噪,得到去除噪声杂点后的字帖。
本发明的特征还在于,
步骤1建立取样样本的具体操作为:
首先在Word文档中输入m页汉字;然后将该Word文档转成pdf格式;最后将pdf格式转成jpg格式图片,最终将得到m张图片,即为取样样本。
步骤2中的具体操作为:
步骤2.1,对步骤1取样样本中的m张图片,每张图片随机切割出i张、大小为c×r的图片,即得到m×i张、大小为c×r的图片;
步骤2.2,对步骤2.1处理后的m×i张图片,每张均制作n个圆形噪声块和n1个方形噪声块,汇总后得到人工噪声数据集;
步骤2.3,将步骤2.1中未加噪声和步骤2.2后加噪声后的图像一一对应,形成m×i个图像对X={noised_img,clean_img},其中noised_img和clean_img分别表示添加噪声后的图像和添加噪声前的图像,得到最终训练数据。
步骤2.2制作圆形噪声块具体操作为:
按照公式(1)进行处理:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810533526.4/2.html,转载请声明来源钻瓜专利网。