[发明专利]一种基于跨分辨率Transformer模型的葡萄叶病斑图像分割方法在审
| 申请号: | 202310045185.7 | 申请日: | 2023-01-30 |
| 公开(公告)号: | CN116091770A | 公开(公告)日: | 2023-05-09 |
| 发明(设计)人: | 穆维松;张馨心;张慧;徐子睿;邹彬 | 申请(专利权)人: | 中国农业大学 |
| 主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/80;G06V10/82;G06N3/0455;G06N3/0464;G06N3/0499;G06N3/08 |
| 代理公司: | 北京众合诚成知识产权代理有限公司 11246 | 代理人: | 陈波 |
| 地址: | 100193 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 分辨率 transformer 模型 葡萄 叶病斑 图像 分割 方法 | ||
本发明属于农业信息技术领域,特别涉及一种基于跨分辨率Transformer模型的葡萄叶病斑分割方法,用于解决自然田间环境中复杂背景的葡萄叶片病斑分割问题。与之前单独考虑获取高分辨特征或语义信息的基于Transformer模型相比,跨分辨率Transformer模型同时考虑保留高分辨率特征和强大的语义信息。跨分辨率Transformer模型为“编码器‑解码器”结构,编码器由4个阶段组成,在第i个阶段中分布有i个并行连接的多分辨率Transformer块,呈金字塔形排布;解码器为汉堡包解码器。每个Transformer块包括大核挖掘注意力机制、多路径前馈网络和跨分辨率融合策略。最后通过汉堡包解码器以融合不同尺度分辨率的特征信息。
技术领域
本发明属于农业信息技术领域,特别涉及一种基于跨分辨率Transformer模型的葡萄叶病斑图像分割方法。
背景技术
植物叶病斑已成为葡萄农业发展的主要障碍,直接导致产量和品质的下降。在病害早期阶段监测疾病信息并制定恰当的措施可以有效控制农业经济损失。自动分割是植物病害检测和鉴定的重要依据,因此对葡萄叶片病斑进行自动分割有助于防止病害蔓延。然而田间葡萄叶病背景复杂,小病区域的边缘纹理丰富,病害症状相似,严重影响病害分割的准确性。为了应对这一挑战,常见的分割方法通常有以下几种:
(1)卷积神经网络
卷积神经网络被广泛应用于农业领域,如Deeplab系列、Unet、PSPnet等。这些网络架构主要是为了通过增加网络深度或引入残差学习来提高模型的分割性能。虽然上述网络在提取病斑特征方面取得了很大的成功,但它们存在一些限制其性能的问题:(1)固定的卷积核约束了感受野的大小,导致对复杂背景的自然图像分割效果不佳;(2)局部连接使其忽略了长距离语义信息交互的关键性;(3)小的目标疾病区域很难被精确分割。为了解决上述问题,有必要在深入理解全局信息的同时提取局部特征,在整个自然场景中探索更多的场景级语义信息。
(2)Transformer
Transformer进一步促进了视觉领域的发展,并在分割任务中出现了比基于卷积神经网络模型更优越的性能。由于具有稳健表征能力的自注意力机制,Transformer在输入具有复杂背景的高分辨率自然图像时,可以明确地对全局上下文信息进行建模。一些研究人员通过改进Transformer提高了植物病斑分割的性能。此外,许多工作通过引入卷积算子、下采样特征图、采用金字塔层次结构和重新设计标记来提取病斑低分辨率特征。然而,他们仍然遵循串联式拓扑结构,逐步使每个阶段输出相同尺度的分辨率特征,但是忽略了同一阶段的不同分辨率之间的信息互动,这导致无法生成高质量的分割图像。在识别具有复杂背景和小目标的葡萄叶病斑时,会造成分割性能降低且边缘细节信息的损失。从经验上看,高分辨率特征图能够获得更细粒度的信息,特别是对于葡萄叶病害边缘。低分辨率特征图通常包含更强的语义表征信息,特别是对于那些难以分割的小目标疾病区域。基于这一原因,同时保持高分辨率特征图和深入的语义信息对于高效处理分割任务是至关重要的。
(3)注意力机制
注意力机制的目标是通过增加输入数据中某些部分的权重而减少其他部分的权重,使网络的注意力集中在最重要的一小部分数据上。注意力机制粗略的被分为两个分支:空间注意力、通道注意力。不同类型的注意力承担着不同的功能。例如,空间注意的目的是增强关键区域的空间特征表征。通道注意力的目的是为不同通道之间的相关性进行建模。然而现有的流行Transformer架构忽略了通道维度适应性的重要性。可以从继承通道注意力与空间注意力二者优势的角度来解决葡萄叶病斑图像分割存在的挑战。
发明内容
本发明的目的在于为葡萄叶片病斑图像分割任务量身定做一个模型,叫做跨分辨率Transformer模型,用于解决自然田间环境中复杂背景的葡萄叶片病斑图像分割的问题。与之前单独考虑获取高分辨率特征或语义信息的基于Transformer的模型相比,跨分辨率Transformer模型同时考虑保留高分辨率特征和强大的语义信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业大学,未经中国农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310045185.7/2.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法





