[发明专利]基于视觉transformer的水稻病害识别方法在审
申请号: | 202111017803.4 | 申请日: | 2021-09-01 |
公开(公告)号: | CN113723312A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 周长建;韩雪;周思寒 | 申请(专利权)人: | 东北农业大学 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150030 黑龙*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 视觉 transformer 水稻 病害 识别 方法 | ||
1.基于视觉transformer的水稻病害识别方法,该方法包括下列顺序的步骤:
(1)采集水稻叶片病害图像数据,将采集到的水稻叶片病害图像统一为224*224像素,并进行标注;
(2)将标注好的水稻叶片病害图像对每个类别按比例进行划分为70%训练集,15%验证集以及15%测试集,并对训练集和验证集进行数据增强以扩充数据量;
(3)构建基于视觉transformer的水稻病害识别模型;
(4)将训练集和验证集输入到步骤(3)构建的视觉transformer模型进行训练,待模型不再收敛时保存训练好的模型;
(5)将测试集输入到步骤(4)训练好的模型进行测试,验证模型效果;
(6)获取待识别的水稻叶片病害图像,进行预处理后输入到步骤(4)训练完成的transformer模型,预测水稻病害类型。
2.根据权利要求1所述的基于视觉transformer的水稻病害识别方法,其特征在于,本发明提供的视觉transformer架构,将每幅图像分割为196个16*16的子图(patch),将分割后的子图展平成2维向量并输入全连接层生成新的2维向量,随后嵌入1维的位置信息token;新的2维向量和1维的token做concatenate后分别输入到ViT和DeiT进行特征提取,其中ViT和DeiT仅采用其特征编码功能,将编码后的特征分别进行Pooling操作,将Pooling操作后的特征进行残差连接成新的特征;随后再将这三个特征进行concatenate后并输入到MLP Head层做分类,预测水稻病害类别。
3.根据权利要求1所述的基于视觉transformer的水稻病害识别方法,其特征在于,所提供的Pooling操作计算方法如下:
Pooling=Normalization(Cat(maxpooling,averagepooling))
其中Cat是联接操作,Normalization是归一化操作。
4.根据权利要求1所述的基于视觉transformer的水稻病害识别方法,其特征在于,在数据增强阶段,本发明采取垂直翻转、向右旋转、向左旋转和水平翻转等数据增强操作,将训练集和验证集扩充到原数据量的5倍大小;测试集不进行增强操作,仍然采用原始数据对模型进行测试。
5.根据权利要求1所述的基于视觉transformer的水稻病害识别方法,其特征在于,模型的训练策略是分层交叉验证stratified 5-fold cross-validation;采用的优化函数是Stochastic gradient descent;损失函数采用的是cross-entropy;激活函数采用的是GeLU。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北农业大学,未经东北农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111017803.4/1.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法