[发明专利]一种基于深度学习的肺部CT图像识别方法在审
申请号: | 202110801472.7 | 申请日: | 2021-07-15 |
公开(公告)号: | CN113327258A | 公开(公告)日: | 2021-08-31 |
发明(设计)人: | 王慧倩;陈俊刚;庞宇;卢毅;王元发;罗家赛 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 肺部 ct 图像 识别 方法 | ||
1.一种基于深度学习的肺部CT图像识别方法,其特征在于,该方法具体包括以下步骤:
S1:获取原始肺部CT图像数据集;
S2:使用改进的U-Net网络对原始肺部CT图像数据集进分割,其中改进的U-Net网络使用Focal Loss作为损失函数提高肺区分割能力;
S3:使用分割后的肺部CT图像作为训练集和测试集,将训练集输入CCT网络进行训练;其中,CCT网络是紧凑型卷积Transformers网络;
S4:将测试集输入至训练好的CCT网络,输出病症类别的概率值,通过概率值确认检测患者的肺部CT图像类别。
2.根据权利要求1所述的肺部CT图像识别方法,其特征在于,步骤S1中,获取的原始肺部CT图像数据集,包括病毒性肺炎患者、细菌性肺炎患者和正常人的肺部CT图像,数量比例为1:1:1。
3.根据权利要求1所述的肺部CT图像识别方法,其特征在于,步骤S2中,改进的U-Net网络结构包括:下采样、上采样以及跳跃连接三部分;首先将该网络分为左右部分来分析,左边是压缩的过程,即编码器;解码器采用4组卷积,每一组包含步幅分别为1和2的两个上采样层,卷积核尺寸全为3×3,输出通道数分别为1、64、128、256、512、1024,得到网络每一层的输出尺寸为568、280、136、64、28;右边部分是解码的过程,即解码器;其中卷积采用valid的填充方式;中间通过连接的方式,将编码阶段获得的特征图同解码阶段获得的特征图结合在一起,结合深层次和浅层次的特征,细化图像,根据得到的特征图进行预测分割;最后一层通过1×1的卷积做分类。
4.根据权利要求1所述的肺部CT图像识别方法,其特征在于,步骤S2中,使用的FocalLoss损失函数,表达式为:
其中,FL表示肺区的分割损失,α为平衡正负样本的数量,γ表示调焦参数,p表示样本的预测概率值。
5.根据权利要求1所述的肺部CT图像识别方法,其特征在于,步骤S3中,所述CCT网络由小跨度的卷积组成,允许有效的标记化并保持局部空间关系;在网络模型中引入感应偏置,使用一个卷积模块代替ViT中的“Image Patching”和“Embedding”层,卷积模块包括单个卷积层、RELU激活和最大池操作;编码器由Transformers块组成,每个Transformer块包括一个多头注意力机制和多层感知器;在添加位置嵌入后应用层范数;Transformers编码器使用层归一化、GELU激活和dropout;使用Sequence Pooling将顺序输出映射到单个类别索引;将跨序列汇集Transformers主干的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110801472.7/1.html,转载请声明来源钻瓜专利网。