[发明专利]一种基于由粗到细密集编解码网络的颞骨内耳骨腔结构自动分割方法在审
| 申请号: | 202110045206.6 | 申请日: | 2021-01-14 |
| 公开(公告)号: | CN112634293A | 公开(公告)日: | 2021-04-09 |
| 发明(设计)人: | 李晓光;伏鹏;朱梓垚;卓力;张辉 | 申请(专利权)人: | 北京工业大学 |
| 主分类号: | G06T7/11 | 分类号: | G06T7/11;G06N3/04;G06N3/08 |
| 代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
| 地址: | 100124 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 细密 解码 网络 颞骨 内耳 结构 自动 分割 方法 | ||
1.一种由粗到细的密集网络进行颞骨内耳骨腔结构的自动分割方法,其特征在于,整体分为3个阶段:基于粗分割的颞骨内耳骨腔结构粗定位、颞骨内耳骨腔结构候选区域提取和颞骨内耳骨腔结构精细分割阶段;
具体包括以下步骤:
1)基于粗分割的颞骨内耳骨腔结构粗定位阶段:
第一步:对颞骨内耳骨腔结构进行粗略分割;在粗分割模型训练阶段,在一例完整的颞骨CT影像数据和标注文件内的相同位置随机抽取48×48×48的立方体,如果该立方体内包含目标结构的标注,则对抽取后的颞骨CT影像立方体HU值截断处理,将HU值小于Tmin的值设置为Tmin,HU值大于Tmax的设置为Tmax,其中,Tmin和Tmax的取值范围在最低HU值到最高HU值之间,在颞骨CT中,空气HU值为-1024,骨质的HU值在300以上,将数据截断到最低-1024,最高截断至2000或以上即可完整的保留颞骨区域用于进一步颞骨分析,并将截断后的HU值归一化到均值为0,方差为1的数据分布,送入粗分割网络进行训练,否则重新抽取同尺寸立方体,直到该范围内抽取到含有解剖结构的标注;
第二步:将完整的颞骨CT影像数据按照重叠滑动窗口的方式,按照顺序切分为多组切块,依次送入训练好的粗分割网络进行分割,并按输入顺序将分割结果叠加恢复至与完整的颞骨CT尺寸一致;选取重叠率为2,对输入的完整颞骨CT影像数据分为多组重叠切块输入分割网络预测;
第三步:根据各结构体素级标注,采用绝对中位差法去除粗分割中产生的离群点;设绝对中位差计算如公式(1)所示:
MAD=median(|Xi-median(X)|) (1)
其中,X是所有被预测为前景点的点集,Xi∈X,是点集X中的第i个点,median(·)为对点集计算中位数,绝对中位差算法过程如下:
(1)计算所有预测前景点坐标的中位数median(X);
(2)计算每个预测前景点与中位数的绝对偏差值abs(Xi-median(X));
(3)计算(2)中的绝对偏差值的中位数MAD;
(4)将(2)中的值除以(3)的值,得到一组基于MAD的所有预测前景点距离中心的距离Dis;计算公式如式(2):
(5)将x、y、z三个维度上最大Dis值大于阈值Th的点作为异常点去除;采用3.5作为筛选阈值,去除远离目标区域的离群点;
2)颞骨关键解剖结构候选区域提取阶段:
第一步,统计颞骨内耳骨腔结构候选区域提取尺寸;基于统计体素级标注数据,统计颞骨内耳骨腔结构所有标注体素点在x、y、z三个维度上的最大值和最小值,以x、y、z最大值与x、y、z最小值之间的差值初步计算解剖结构的体素坐标跨度,根据每例CT的像素间距和层间距,计算每例CT内耳骨腔结构对应的实际物理包围框尺寸,将每个结构实际物理尺寸最大值向外扩延至24mm×24mm×24mm,以层间距、像素间距为0.5mm的颞骨CT取48×48×48的立方体,即可在保证完整包围目标分割结构的同时满足分割算法的输入,作为候选区域的提取尺寸;
第二步,结合待分割解剖结构粗定位中心点和解剖结构先验包围框尺寸信息,提取感兴趣区域;感兴趣区域通过区域中心点和三维尺寸描述,其中,以第一阶段预测的颞骨待分割关键解剖结构的中心点为中心,向外扩延提取立方体数据,立方体三维尺寸按照第一步统计计算的颞骨各个待分割解剖结构对应的包围框尺寸,以提取后的子区域作为进一步精确分割的候选区域,并对提取子区域位置进行记录;
3)颞骨内耳骨腔结构精细分割阶段:
该精细分割阶段具体包括编码和解码两个过程;
a)编码阶段
第一步:数据截断和归一化;将第2)阶段提取的颞骨内耳骨腔结构候选区域48×48×48体素长度子区域送入精准分割算法;将CT影像数据的子区域CT值按照颞骨CT的HU值分布范围进行数据截断,对于颞骨CT而言,可将小于Tmin的值截断至Tmin,大于Tmax的值截断至Tmax,Tmin与Tmax的选取和第一阶段基于粗分割的颞骨内耳骨腔结构粗定位取值一致,并进行归一化为均值为0,方差为1的数据分布;
第二步:采用带有空洞卷积的密集连接网络提取特征;将第一步数据截断和归一化后的48×48×48完整包含待分割颞骨内耳骨腔结构的子区域送入网络;编码阶段共设计了3组密集连接模块;该模块由批归一化-修正线性单元-卷积层、拼接和瓶颈层三部分组成,其中,密集连接模块所有卷积尺寸为3×3×3;密集连接块中的批归一化-修正线性单元-卷积层是由批归一化、修正线性单元和卷积层三个操作组成;拼接是将特征图在通道层面进行级联;瓶颈层的作用是减少密集连接块输出的特征图数量;在第三组密集连接模块中,采用了空洞卷积模块;
第三步:多池化特征融合;在每一层级的密集连接模块输出之后采用批归一化-修正激活单元-卷积层,为了防止过拟合,在此后通常采用Dropout层,Dropout率设置为0.5,在其之后同时采用3D最大池化和3D平均池化,将池化之后的结果做一个拼接;
b)解码阶段
第一步:采用转置卷积和密集连接模块进行特征的上采样;在解码过程中,采用带有密集连接模块的转置卷积,进行语义信息的解码;对编码阶段最后一层尺寸为12×12×12的张量特征数据,采用两次转置卷积进行上采样,将张量特征数据恢复至原始输入的48×48×48尺寸;在解码阶段的两次转置卷积后面,将密集连接块代替普通卷积层;
第二步:3D深监督机制;在编码阶段,第一个密集连接网络块输出的特征采用64个卷积核提取特征,之后先经过一个1×1×1的卷积,紧接其后的是一个softmax层,输出辅助分割结果;解码阶段的第二层对拼接后的特征进行卷积操作进一步提取特征,将得到的特征先经过转置卷积提升分辨率,然后经过采用1×1×1卷积核的softmax层,得到第二个辅助分割结果;解码阶段最后一层对拼接后的特征经过包含不同卷积核的卷积操作之后输出主干网络的预测结果;在网络训练的过程中主干网络的损失函数与分支网络的损失时函数共同构成联合目标函数,包含Coefficient(DSC)损失函数和交叉熵损失函数;DSC损失函数定义如公式(3)所示:
其中X和Y分别表示预测体素与真实目标体素,n表示待分割目标的类别数,xi与yi分别表示预测体素数据与真实目标体素数据中包含的目标标记体素的数量;为交叉熵损失函数引入权重记为W,如公式(4)所示:
其中Nk表示待分割体素数据中目标体素标记的数量,Nc表示待分割体素数据中全部体素的数量;交叉熵损失函数如公式(5)所示:
基于上面定义的损失函数构建联合目标函数如公式(6)所示:
其中m为受监督的隐藏层的个数,λ1k和λ2k为第k个受监督的隐藏层损失函数的超参数,m为2,超参数λ1k和λ2k分别取值0.6和0.3,Lk和Hk分别为第k个受监督的隐藏层DSC损失函数和交叉熵损失函数;基于主干网络和分支网络的损失函数构建目标损失函数共同指导网络训练,减轻梯度消失,加快网络的收敛速度;
第三步:采用精准分割算法预测分辨率为48×48×48的分割结果,按照第2)阶段记录的候选区域提取位置,还原至在完整CT中的对应位置,作为最终分割结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110045206.6/1.html,转载请声明来源钻瓜专利网。





