[发明专利]基于卷积神经网络的书法风格识别方法有效
申请号: | 201810662708.1 | 申请日: | 2018-06-25 |
公开(公告)号: | CN108985348B | 公开(公告)日: | 2019-06-14 |
发明(设计)人: | 张九龙;张福成;屈小娥 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 许志蛟 |
地址: | 710048*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型分类 书法风格 卷积神经网络 训练样本集 验证 样本集 准确率 书法 样本 预处理 扩展性 处理流程 迭代训练 风格识别 过程实现 书法图像 书法作品 数量比较 特征提取 样本输入 鲁棒性 用时 收敛 融为一体 风格 | ||
1.基于卷积神经网络的书法风格识别方法,其特征在于,包括以下步骤:
步骤1,获得并预处理书法作品,得到书法样本;
步骤2,将步骤1的书法样本分成训练样本集和验证样本集;
步骤3,将步骤2中的训练样本集输入模型分类器并不断迭代训练,同时使用验证样本集不断验证模型分类器;
将步骤2中的训练样本集批量输入模型分类器中,首次迭代时,模型分类器权重参数为随机初始化参数,通过前向传播算法不断向前传递特征,并计算残差,随后通过反向传播算法将残差不断向后传递,修正权重参数,不断迭代直至收敛;
当模型分类器中每迭代10次,将验证样本集输入模型分类器中识别准确率:当识别准确率出现两极分化,则需要重新训练模型分类器;如未出现两极分化,继续训练;
收敛的条件为:迭代次数不大于在10000且达到残差值最小;
步骤4,将步骤1的书法样本输入步骤3训练后的模型分类器中,完成书法风格识别;
所述模型分类器中网络模型包含11层,输入是通道为1的灰度图像,分辨率大小64×64;
第一层是32个感受野大小为5×5的卷积层,步长为1,边缘填充为2,参数量为5×5×1×32+32,即832,输出为32个通道、大小为64×64的特征;
第二层采用重叠的最大池化层,即感受野大小为3×3,步长为2,边缘填充为1,输出为32个通道,图像大小为64×64的特征;
第三层至第六层是两组与第一层和第二层相类似的卷积层和最大池化层:第三层的卷积核数量是32,大小5×5,边缘填充为2,步长为1,参数量为5×5×32×32+32,即26624;第五层是64个卷积核大小为5×5卷积层,步长为1,边缘填充是2,该卷积层的参数量为5×5×32×64+64,即53248;第四层和第六层均为最大池化层;
第七层为卷积层,即128个大小为5×5的卷积核,步长为1,边缘填充为2,参数量为5×5×64×128+128,即212992;
第八层为平均池化层,感受野大小为3×3,步长为2,边缘填充为1,输出为128个通道,图像大小为4×4的特征;
第九层为Concat(avg,std)层,在第七层的卷积和第八层放平均池化层之后的输出为128×4×4,即128个通道大小为4×4的特征作为Concat(avg,std)层的输入;
第十层为全连接层,全连接层的输入为128个4×4的特征,输出为256个特征,则参数量为4×4×128×256+256,即524288;
第十一层为softmax分类层,用于计算输出属于每一类的概率。
2.根据权利要求1所述的基于卷积神经网络的书法风格识别方法,其特征在于,所述步骤1具体为:
步骤1.1,将每幅书法作品处理成图像格式,随后应用最小包围将每幅书法作品切割成无畸变的单个书法字图像;
步骤1.2,通过中心填充归一化,将步骤1.1得到的单个书法字图像归一化成大小统一的正方形单字图像;
步骤1.3,将步骤1.2的正方形单字图像统一压缩至分辨率为64×64的单个书法字图像,得到书法样本。
3.根据权利要求1所述的基于卷积神经网络的书法风格识别方法,其特征在于,所述步骤2具体为:
将步骤1得到的书法样本按照9:1的比例随机分为训练数据集和验证数据集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810662708.1/1.html,转载请声明来源钻瓜专利网。