[发明专利]一种基于方向特征增强的书法图像风格分类方法在审
| 申请号: | 202111182612.3 | 申请日: | 2021-10-11 |
| 公开(公告)号: | CN114118186A | 公开(公告)日: | 2022-03-01 |
| 发明(设计)人: | 张九龙;于文航;屈小娥 | 申请(专利权)人: | 西安理工大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06K9/00 |
| 代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 白文佳 |
| 地址: | 710048*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 方向 特征 增强 书法 图像 风格 分类 方法 | ||
本发明公开了一种基于方向特征增强的书法图像风格分类方法,本发明提取不同的书法风格的原始图像,将收集好的原始图像分为训练集和测试集,使用2D‑Gabor滤波器对训练集图像中的每一张图像进行八个方向的方向特征提取,然后将提取到的方向特征对原始图像进行增强,输入深度卷积神经网络中进行训练,每训练一定次数,将深度卷积神经网络在测试集上进行测试,得到测试准确率,将最高的测试准确率对应的权重参数保存下来,和深度卷积神经网络组成最终的书法风格分类器。本发明采用2D‑Gabor滤波器提取书法图像方向特征映射作为先验知识,来增强原始图像的特征表示,从而使本发明不仅具有较高的分类准确率,同时具备较好的泛化能力。
技术领域
本发明属于人工智能领域,具体涉及一种基于方向特征增强的书法图像风格分类方法。
背景技术
中国书法作品是文化瑰宝,具有重要的研究价值。在中华文化发展的历史中留下了难以计数,内涵丰富的书法字体。我国古代著名的楷书四大家:欧阳询,颜真卿,柳公权,赵孟頫。他们所创的书法风格:欧体,颜体,柳体,赵体影响深远,至今仍被许多人喜欢和临摹。
这四种书法风格本质属于楷体书法。他们之间笔画的特征差别较小,这对于未经训练过的人来说难以分辨。如果寻找有经验的书法家来完成四种书法风格之间的分类工作,相当耗费人力。
在此之前虽然有使用卷积神经网络(CNN)等方法来自动分类四种书法风格,但是分类结果的精度还有继续提升的空间。随着CNN结构的不断发展,很多研究已经表明随着CNN层数的增加,深度卷积神经网络(DCNN)从图像中学习到的特征更加丰富。然而它们学习特征的行为被认为是黑盒子,通常忽略了一些特定领域的先验信息。
发明内容
本发明的目的在于克服上述不足,提供一种基于方向特征增强的书法图像风格分类方法,解决了现有技术中存在的书法风格分类准确率不高的问题,并提高分类模型的泛化能力。
为了达到上述目的,本发明包括以下步骤:
S1,提取不同的书法风格的原始图像,组成数据集,并分成训练集和测试集;
S2,构建深度卷积神经网络DCNN;
S3,采用2D-Gabor滤波器对训练集图像进行八个方向的特征提取,转换为方向特征图像;
S4,将S3中提取的方向特征图像与原始图像一起送入到S2构建的深度卷积神经网络DCNN中进行训练;
S5,每训练固定次数后,将训练后的深度卷积神经网络DCNN在测试集上进行测试,得到每次的测试准确率,选取准确率最高的权重参数以及对应的深度卷积神经网络DCNN作为最终书法风格分类的分类器。
S1的具体步骤如下:
利用最小包围盒切算法从不同的书法风格的整幅作品中分割出单个字符图像,每种书法风格的书法字符图像数量相等;
将每种书法风格的书法字符图像按预设比例分为训练集和测试集。
S2中,深度卷积神经网络DCNN包括卷积层Conv、最大池化层MaxPool、批量归一化层BN、ReLU非线性激活函数、注意力模块CBAM、全局平均池化层Global Average Pool、全连接层FC和非线性激活函数Softmax。
S3中,2D-Gabor滤波器通过如下公式对训练集图像进行八个方向的特征提取:
其中,x和y为输入图像的像素,α为滤波器的旋转角度,Θk为旋转的八个不同的方向,k取0,1,2...7,β的计算方法如下:
G1的计算方法如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111182612.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种轻质印刷纸及其制备方法
- 下一篇:一种晶体管线缆用的保护装置





