[发明专利]一种结合改进注意力机制和知识蒸馏的茶叶嫩芽分级方法有效
| 申请号: | 202111017041.8 | 申请日: | 2021-08-31 |
| 公开(公告)号: | CN113807215B | 公开(公告)日: | 2022-05-13 |
| 发明(设计)人: | 黄海松;陈星燃;范青松;张卫民;胡鹏飞;韩正功 | 申请(专利权)人: | 贵州大学 |
| 主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/40;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 南京禹为知识产权代理事务所(特殊普通合伙) 32272 | 代理人: | 刘小莉 |
| 地址: | 550025 *** | 国省代码: | 贵州;52 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 结合 改进 注意力 机制 知识 蒸馏 茶叶 嫩芽 分级 方法 | ||
1.一种结合改进注意力机制和知识蒸馏的茶叶嫩芽分级方法,其特征在于,包括:
采集茶叶嫩芽图像并进行初步筛选,预处理初步筛选得到的茶叶嫩芽图像,建立所需的茶叶嫩芽数据集;
基于改进的注意力机制,构建多尺寸卷积块注意力模块,并建立茶叶嫩芽分级模型,利用两不同源域数据集预训练所述茶叶嫩芽分级模型和Resnet32模型,得到两者权重参数;
搭建茶叶嫩芽分级模型:在ShuffleNet V2 0.5x的基本单元中引入多尺度卷积块注意力模块和多尺度深度捷径构建一种用以对茶叶嫩芽进行分级的轻量型模型:ShuffletNetV2 0.5x-MAU;
具体的,搭建通道注意力模块,通过通道注意力模块生成通道注意力特征图的过程如下:
其中,F为输入模块的特征,为经平均池化处理后的特征,为经最大池化处理后的特征,σ为Sigmoid激活函数,W1、W2为多层感知机的权重系数;
利用多尺度卷积层替代原空间注意力模块中的传统卷积层,并通过1×1大小的卷积层对通道数目进行调整,生成多尺度空间注意力模块,使模型能够在充分挖掘多尺度特征信息的同时,对茶叶图像中有利于分级的复杂特征信息进行目的性提取,通过所述多尺度空间注意力模块生成多尺度空间特征图的过程如下:
MMS=σ(f1×1(f5×5(AvgPool(F))+f9×9(MaxPool(F))))
其中,f1×1为1×1卷积核大小的卷积层,f5×5为5×5卷积核大小的卷积层,f9×9为9×9卷积核大小的卷积层,依次为经过平均池化和最大池化处理后的特征;
结合通道注意力模块与多尺度空间注意力模块,构建多尺寸卷积块注意力模块,输入特征经通道注意力模块处理得到加权结果后,再由多尺度空间注意力模块得到输出特征信息,由多尺度空间注意力模块得到输出特征信息的过程包括:
其中,为元素逐点相乘,F'为特征经通道注意力模块处理后生成的特征图与初始输入特征逐点相乘所得的新特征图,F”为特征经多尺度空间注意力模块处理生成的特征图与F'逐元素相乘所得的输出特征图;
搭建ShuffleNet V2 0.5x网络基本单元;
在网格基本单元中以串行的方式嵌入多尺寸卷积块注意力模块,引入三组深度不同的多尺度深度捷径构建多尺度注意力单元,并以此为核心构建茶叶嫩芽分级模型:ShuffletNet V2 0.5x-MAU;
进一步的,茶叶嫩芽分级模型及Resnet32模型的预训练:以Oxford-102 flower数据集对ShuffletNet V2 0.5x-MAU模型进行预训练,以ImageNet数据集对Resnet32模型进行预训练,并保存两者权重参数;
将两个预训练后模型的权重参数迁移至自建的茶叶嫩芽数据集上并引入知识蒸馏技术,形成一种结合双迁移学习和知识蒸馏的模型训练策略以训练所述茶叶嫩芽分级模型;
将测试集中待分级的茶叶嫩芽图像导入训练好的茶叶嫩芽分级模型,记录分级结果的各项指标及模型规格参数。
2.如权利要求1所述的结合改进注意力机制和知识蒸馏的茶叶嫩芽分级方法,其特征在于:所述采集茶叶嫩芽图像并进行初步筛选包括,
利用中科微创ZW-C3600工业相机、变焦镜头及LED环形补光灯搭建平台实现对茶叶嫩芽图像的采集,并在拍摄过程中固定镜头焦距和距样本的距离,且所有样本使用同一白色A4纸作为底版;
将采摘的茶叶嫩芽按照单芽、一芽一叶、一芽两叶三个级别分为三个独立集合,通过所搭建的图像采集平台进行拍摄,并通过人工对质量较差的数据进行清洗后获取到各级别茶叶嫩芽原始图像数据各400张。
3.如权利要求1或2所述的结合改进注意力机制和知识蒸馏的茶叶嫩芽分级方法,其特征在于:所述预处理初步筛选得到的茶叶嫩芽图像,建立所需的茶叶嫩芽数据集包括,
在PyCharm编译器上利用Opencv库实现:将采集到的茶叶嫩芽图像通过中心裁剪为像素大小为224×224的图像后,依次通过翻转、平移、旋转及添加高斯噪声四种方式对数据进行扩容处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于贵州大学,未经贵州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111017041.8/1.html,转载请声明来源钻瓜专利网。





