今天将分享Unet的改进模型SDU-Net,改进模型来自2020年的论文《UNet Using Stacked Dilated Convolutions for Medical Image Segmentation》,简单明了给大家分析理解该模型思想。
1、SDU-Net网络优点
UNet体系结构适用于图像分割,部分原因是编码器和解码器之间的跳过连接对于上采样较低分辨率层是至关重要。但是,U-Net架构引入了折衷:
(1)U-Net卷积的感受野非常有限,编码器下采样可能会降低像素之间的相关性。为了获得更大的感受野,Devalla等将空洞卷积引入U-Net,其中,在降低分辨率的同时,空洞率增加。然而Hamaguchi等指出,由于核的稀疏性,大幅度提高空洞率可能无法融合局部特征,并可能损害小物体。
(2)现有方法基于未明确的假设,即每个编码器/解码器操作在像素处感知并输出单个感受野,这可能会限制感受野的种类。
(3)一些医学成像模式,尤其是超声,需要高的时间分辨率,但又要高效地使用计算资源,从而限制了计算密集型网络体系结构的部署。
为了充分利用U-Net的优越分割性能,同时缓解诸如简单和小的感受野之类的缺点,文章提出了一种新颖的UNet变体(SDU-Net),该变体使用多次空洞卷积来处理每个分辨率的特征图并把所有卷积输出结果拼接到一起,作为下一个分辨率的输入。级联处理逐渐增加了感受野,而拼接获得相同的分辨率下的多个感受野。由于U-Net架构以多种分辨率来处理图像,因此SDU-Net能够同时感知到高分辨率和低分辨率下不同大小的感受野。文中的实验表明,SDU-Net在使用更少参数的情况下优于最新算法。
2、SDU-Net结构
SDUNet是在Unet网络如图1所示上进行的修改,不同之处在于,在编码和解码操作中,UNet是使用两个标准的卷积网络操作,并把第二个卷积网络的输出作为下一个操作的输入,而SDUNet是采用一个标准卷积跟着多个空洞卷积,并将所有空洞卷积拼接在一起作为下一个操作的输入。从下图可以看到,在编码器处理的时候,首先对上一层结果进行降采样处理,再经过一个标准卷积网络,紧跟着4个空洞卷积,每个卷积的通道个数是输出的1/2,1/4,1/8,1/16,1/16,然后将5个卷积进行拼接回到输出特征通道个数。而解码器处理的时候,首先对上一层结果进行上采样处理,然后在与相对应的编码器特征图进行拼接,再经过一个标准卷积网络,紧跟着4个空洞卷积,每个卷积的通道个数是输出的1/2,1/4,1/8,1/16,1/16,然后将5个卷积进行拼接回到输出特征通道个数。
对于每个编码/解码操作,SDUNet(一个标准卷积和四个空洞卷积)比UNet(两个标准卷积)更深,有更大的感受野。SDU-Net将所有空洞卷积的特征图拼接到下一个编码器/解码器操作中,相同分辨率的特征图可以感知到多尺度的感受野。在实验中,通道个数设置n1为64,n2为128,n3为256,n4为512。
3、实验设置与结果
3.1、数据集,采用了四种数据集肝脏和肾脏超声图像,乳腺病变超声图像,甲状腺结节超声图像和皮肤癌图像ISIC2018数据集。
3.2、训练过程,采用5折交叉验证方法,验证集设置成训练数据的20%。采用bi-Dice函数,Adam优化器,学习率为0.00005,batch大小设置成4,训练次数为500epoch。
3.3、结果,从下面的表格和分割结果上,可以看到SDUNet的分割结果优于UNet,AttUnet和R2UNet网络。