论文阅读: 1412.Deeplabv1

2021-12-06 21:37:39 浏览数 (1)

1412.7062:Semantic Image Segmentation with Deep Convolutional

Deeplab系列是很成熟优雅的结构,以至于现在的很多改进是基于这个网络结构的进行的。

  • 受制于当时的basemodel发展水平,DeepLabv1仅使用VGGNet进行实验。

创新点

  • 提出了一种新的卷积:空洞卷积(Atrous Convolution):
    • 解决的痛点:普通的卷积和池化层会导致最终的特征图极小,特征图经过上采样再输出成分割结果,这样的上采样就有些“放大过度”了。
    • 空洞卷积 :对backbone的最后一个block卷积步幅设置为1,使用rate=2的空洞卷积替代原有后续的所有卷积,使得输出变大,避免池化层丢失图像信息。
  • 提出了全连接的条件随机场(Conditional Random Field,CRF):
    • 解决的痛点:普通的深度卷积网络分割结果比较粗糙,无法识别目标的细节。
    • CRF优化精度:对最终的输出层结果每个像素点之间增加连接,就是每个像素点作为节点,像素与像素间的关系作为边,通过二元势函数描述像素点。与像素点之间的关系,鼓励相似像素分配相同的标签,而相差较大的像素分配不同标签,而这个“距离”的定义与颜色值和实际相对距离有关。

0 人点赞