[发明专利]基于CT图像的可解释性肺结核分类网络识别方法有效
申请号: | 202110337007.2 | 申请日: | 2021-03-30 |
公开(公告)号: | CN113095382B | 公开(公告)日: | 2022-07-26 |
发明(设计)人: | 金心宇;马云龙;余晨洋;金昀程 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州中成专利事务所有限公司 33212 | 代理人: | 金祺 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 ct 图像 解释性 肺结核 分类 网络 识别 方法 | ||
1.基于CT图像的可解释性肺结核分类网络识别方法,其特征在于包括以下步骤:
S01、获取待测人员肺部计算机断层成像CT图像,作为原始CT图像并输入到上位机中进行图像预处理,进行肺实质的提取得到肺实质图像,然后将肺实质图像进行归一化处理并缩放到512x512大小;
S02、建立并训练可解释性肺结核分类网络,可解释性肺结核分类网络以残差网络为基础网络并加入Dense思想和改进后的注意力机制而建立;
S03、将归一化处理并缩放到512x512大小的肺实质图像送入到训练好的可解释性肺结核分类网络,得到并在上位机中输出待测人员肺结核的分类结果和相应的类激活热力图;
所述可解释性肺结核分类网络包括第一层为卷积层,卷积核尺寸为7x7,步幅为2;第二层为最大池化层,卷积核尺寸为3x3,步幅为1;第三层到第五层、第七层到第九层、第十一层到第十五层、第十七层到第十九层共计14个block-1模块,每个block-1模块均分为3个卷积层,第一层卷积核尺寸为1x1,第二层卷积核尺寸为3x3,步幅为1,第三层卷积核尺寸为1x1;第六、十、十六层均为blocl-2降采样模块,每个blocl-2降采样模块均分为三个卷积层,第一层卷积核尺寸为1x1,第二层卷积核尺寸为3x3,步幅为2,第三层卷积核尺寸为1x1;第二十层为全局平均池化,第二十一层为全连接层;第三层与第六层、第六层和第十层、第十层和第十六层、第十六层和第二十层相互之间进行短接操作,相同尺寸的为同一残差块,共计4个残差块;
所述Dense思想为将第三层到第五层作为一个稠密块进行短接操作,将第六层到第九层作为一个稠密块进行短接操作,将第十层到十五层作为一个稠密块进行短接操作,将第十六层到第十九层作为一个稠密块进行短接操作;
在第五层和第六层之间、在第九层和第十层之间、在十五层和十六层之间和在第十八层和十九层之间分别加入所述改进后的注意力机制;
第二十一层的全连接层之后为分类函数softmax,最终输出待测人员肺结核的分类结果;
第二十层全局平均池化后输出的特征图采用梯度加权的类激活映Grad-CAM方法处理,Grad-CAM根据输出向量,进行backward,求取特征图的梯度,得到特征图对应的梯度图,然后再对每个梯度图求平均获得每个特征图的权重,然后再将权重与特征图进行加权求和,通过激活函数relu后,最终输出显著性区域图;
所述改进后的注意力机制包括基于传统的注意力机制,在通道注意力支路中,采取将全局最大池化和全局平均池化的两个池化结果进行拼接的方法;在空间注意力支路上,采用Conv1×1和Conv3×3两种大小的卷积核的并行结构对输入特征矩阵进行特征提取,将Conv3×3大小的卷积核分解为Conv1×3和Conv3×1的卷积核,利用矩阵运算中对应元素相乘的方法,将两路特征进行融合。
2.根据权利要求1所述的基于CT图像的可解释性肺结核分类网络识别方法,其特征在于:
步骤S01中的所述图像预处理包括以下过程:
对原始CT图像进行二值化:设置全局初始的阈值T为原始CT图像中最大灰度值和最小灰度值的平均值,以阈值T为分割点将原始CT图像的所有像素值分为两组,并对这两个组的像素分别计算平均值得到Tf和Tb,然后以Tf和Tb的平均值作为新的阈值并更新阈值T,不断迭代直到所得的阈值T与前一个阈值T之差小于设定的参数T0,从而获得二值化后的图像,T0为接近于0预设值;将二值化后的图像采用泛洪算法进行胸腔填充,除去肺实质中的孔洞和床板,获得孔洞填充后的图像;对孔洞填充后的图像进行取反,并去除气管,得到肺部掩膜图像;用得到的肺部掩膜图像与原始CT图像相乘得到肺实质图像。
3.根据权利要求2所述的基于CT图像的可解释性肺结核分类网络识别方法,其特征在于:
步骤S02中所述训练可解释性肺结核分类网络包括:
1)、建立数据集
首先收集大量待测人员的肺部CT图像按所述图像预处理获得肺实质图像,然后由检测人员对肺实质图像进行标注,并将肺实质图像和对应的标签按20%、20%、60%的比例作为训练集、验证集和测试集;采用翻转、旋转、裁剪三种数据增强方法处理训练集和验证集的肺实质图像,对所有数据增强后的肺实质图像进行归一化处理并缩放到512x512大小,和对应的标签作为可解释性肺结核分类网络的训练输入;对所有测试集的图像直接进行归一化处理并缩放到512x512大小,和对应的标签作为可解释性肺结核分类网络的测试输入;
2)、采用交叉熵公式作为损失函数,输入训练集和验证集中归一化后的512x512的肺实质图像,经过可解释性肺结核分类网络的网络传播获得待测人员肺结核的分类结果,与对应的标签对比计算损失函数,再利用损失函数的结果进行梯度下降来更新网络的参数,得到训练完成的可解释性肺结核分类网络;
3)、将测试集中经过归一化后并缩放到512x512的肺实质图像输入到训练好的可解释性肺结核分类网络获得待测人员肺结核的分类结果,与对应的标签进行对比,统计准确率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110337007.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:光学系统、摄像模组和电子设备
- 下一篇:一种多模光纤光程变化测量系统
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序