[发明专利]一种基于门控注意力结构的眼底图像实例分割方法及系统在审
申请号: | 202210508601.8 | 申请日: | 2022-05-11 |
公开(公告)号: | CN114612670A | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 张冬冬 | 申请(专利权)人: | 北京至真互联网技术有限公司 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/25;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100085 北京市昌平区回龙观*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 门控 注意力 结构 眼底 图像 实例 分割 方法 系统 | ||
1.一种基于门控注意力结构的眼底图像实例分割方法,其特征在于,所述方法包括:
获取待使用的眼底图像;
利用门控分割模型对所述眼底图像进行图像分割,得到每个像素类别的概率;所述门控分割模型包括n层连续的下采样层和n层连续的上采样层,第n层下采样层与第一层上采样层连接:
采用所述门控分割模型对所述眼底图像进行连续n层降采样,得到n层降采样输出特征;
将第i层降采样输出特征与第n-i+1层的上采样层的输出特征输入门控注意力结构,得到第n-i+1层门控特征,并将第n-i+1层门控特征与第n-i+1层的上采样层的输出特征堆叠后输入第n-i+2层上采样层,;其中,将第1层降采样输出特征与第n层的上采样层的输出特征输入门控注意力结构,得到第n层门控特征,并将第n层门控特征与第n层的上采样层的输出特征堆叠,得到堆叠特征;
对所述堆叠特征进行分类卷积操作,得到每个像素的类别概率。
2.根据权利要求1所述的基于门控注意力结构的眼底图像实例分割方法,其特征在于,在所述获取待使用的眼底图像之后,还包括:
将所述待使用的眼底图像的无效黑边区域裁掉。
3.根据权利要求1所述的基于门控注意力结构的眼底图像实例分割方法,其特征在于,在所述获取待使用的眼底图像之后,还包括:
利用createCLAHE函数对所述待使用的眼底图像进行自适应直方图均衡化处理,得到均衡化图像;
利用resize函数将所述均衡化图像统一缩放到标准大小。
4.根据权利要求1所述的基于门控注意力结构的眼底图像实例分割方法,其特征在于,所述采用所述门控分割模型对所述眼底图像进行连续n层降采样,得到n层降采样输出特征,具体包括:
对所述眼底图像进行n次卷积操作、Relu函数激活操作和最大池化操作,得到n层降采样输出特征。
5.根据权利要求1所述的基于门控注意力结构的眼底图像实例分割方法,其特征在于,所述对所述堆叠特征进行分类卷积操作,得到每个像素的类别概率,具体包括:
对所述堆叠特征进行卷积操作,得到每个像素的类别概率;其中,
6.根据权利要求1所述的基于门控注意力结构的眼底图像实例分割方法,其特征在于,在所述对所述堆叠特征进行分类卷积操作之后,还包括:
利用softmax归一化函数对卷积结果进行归一化。
7.根据权利要求1所述的基于门控注意力结构的眼底图像实例分割方法,其特征在于,所述将第i层降采样输出特征与第n-i+1层的上采样层的输出特征输入门控注意力结构,得到第n-i+1层门控特征,具体包括:
分别对第i层降采样输出特征和第n-i+1层的上采样层的输出特征进行1x1卷积操作,得到编码特征图和解码特征图;
将所述编码特征图和所述解码特征图中相对应的特征相加,得到叠加特征图;
对所述叠加特征图进行1x1x1卷积操作,得到卷积特征图;
将所述卷积特征图进行Sigmoid归一化,得到注意力权重矩阵;
将所述注意力权重矩阵与相应的所述输出特征进行点乘运算,得到第n-i+1层门控特征。
8.根据权利要求1所述的基于门控注意力结构的眼底图像实例分割方法,其特征在于,所述门控分割模型的训练过程,具体包括:
获取标注图像;所述标注图像为通过专业眼科医师标注过目标区域的图像;
利用所述标注图像训练基于门控注意力机制的网络模型,得到门控分割模型。
9.根据权利要求8所述的基于门控注意力结构的眼底图像实例分割方法,其特征在于,在训练过程中利用正向旋转、反向旋转、垂直翻转、水平翻转、随机裁剪、亮度变化、对比度变换以及高斯模糊的方法进行图像扩增。
10.一种基于门控注意力结构的眼底图像实例分割系统,其特征在于,所述系统包括:
数据获取单元,用于获取待使用的眼底图像;
病变分割单元,用于利用门控分割模型对所述眼底图像进行图像分割,得到病变概率:所述门控分割模型包括n层连续的下采样层和n层连续的上采样层,第n层下采样层与第一层上采样层连接;
降采样模块,用于采用所述门控分割模型对所述眼底图像进行连续n层降采样,得到n层降采样输出特征;
门控上采样模块,用于将第i层降采样输出特征与第n-i+1层的上采样层的输出特征输入门控注意力结构,得到第n-i+1层门控特征,并将第n-i+1层门控特征与第n-i+1层的上采样层的输出特征堆叠后输入第n-i+2层上采样层,;其中,将第1层降采样输出特征与第n层的上采样层的输出特征输入门控注意力结构,得到第n层门控特征,并将第n层门控特征与第n层的上采样层的输出特征堆叠,得到堆叠特征;
分割模块,用于对所述堆叠特征进行分类卷积操作,得到每个像素的类别概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京至真互联网技术有限公司,未经北京至真互联网技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210508601.8/1.html,转载请声明来源钻瓜专利网。