[发明专利]一种基于跨分辨率Transformer模型的葡萄叶病斑图像分割方法在审
| 申请号: | 202310045185.7 | 申请日: | 2023-01-30 |
| 公开(公告)号: | CN116091770A | 公开(公告)日: | 2023-05-09 |
| 发明(设计)人: | 穆维松;张馨心;张慧;徐子睿;邹彬 | 申请(专利权)人: | 中国农业大学 |
| 主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/80;G06V10/82;G06N3/0455;G06N3/0464;G06N3/0499;G06N3/08 |
| 代理公司: | 北京众合诚成知识产权代理有限公司 11246 | 代理人: | 陈波 |
| 地址: | 100193 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 分辨率 transformer 模型 葡萄 叶病斑 图像 分割 方法 | ||
1.一种基于跨分辨率Transformer模型的葡萄叶病斑图像分割方法,其特征在于,跨分辨率Transformer模型为“编码器-解码器”结构,编码器由4个阶段组成,在第i个阶段中分布有i个并行连接的多分辨率Transformer块,呈金字塔形排布;解码器为汉堡包解码器。
2.根据权力要求1所述的多分辨率Transformer块,其特征在于,其网络架构包括大核挖掘注意力机制、多路径前馈网络和跨分辨率融合策略。
3.根据权力要求2所述的大核挖掘注意力机制,其特征在于,卷积核大小设置为11×11,以扩大感受野,输入数据经过重叠特征嵌入和重塑后,传入大核挖掘注意力机制,通过哈达玛算子计算注意力机制的输出特征。
4.根据权力要求2所述的多路径前馈网络,其特征在于,多路径前馈网络考虑了多层次语义挖掘的重要性,应用k×1和1×k的双分支卷积对和扩展比r来实现,其中,k的取值设置为3和5,r的取值设置为4,具体公式为:
x3=Conv3×1(Conv1×3(Linear(xin)))
x5=Conv5×1(Conv1×5(Linear(xin)))
xout=Cat(x3,x5)+xin
其中LN归一化和激活层(GELU)被省略,xin表示从大核挖掘注意力机制中输出的特征,xout表示从多路径前馈网络输出的特征。
5.根据权力要求2所述的跨分辨率融合策略,其特征在于,通过二进制循环构建一个静态的二维矩阵,并将语义信息通过上采样或下采样进行融合,低分辨率特征图分支的语义信息上采样至高分辨率特征图分支,以提取更大感受野的语义特征,高分辨率特征图被下采样至低分辨率特征图以保持更多的图像细节,从而实现对具有复杂背景的小目标病害的准确分割。
6.根据权力要求1所述的汉堡包解码器,其特征在于,该解码器利用矩阵分解方法对全局空间信息进行建模,聚合最后三层的上下文信息,以融合不同尺度分辨率的特征信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国农业大学,未经中国农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310045185.7/1.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法





