论文阅读: 1411.FCN

2021-12-06 21:37:09 浏览数 (2)

1411.4038:Fully Convolutional Networks for Semantic Segmentation

深度学习应用于图像语义分割的开山之作(难免效果很糙),CVPR2015 Best Paper。

创新点

  • 卷积化(Convolutional): 丢弃全连接,换成卷积层。(已变成了固定结构)
    • 分类使用的网络通常会在最后连接几层全连接层,它会将原来二维的矩阵(图片)压扁成一维的,从而丢失了空间信息,最后训练输出一个标量(分类标签)。
    • 而图像语义分割的输出需要是个分割图,且不论尺寸大小,但是至少是二维的。所以,我们需要丢弃全连接层,换上全卷积层,而这就是全卷积网络了。
  • 反卷积(Deconvolution):为了上采样得到和原图等大的分割图。(deconv已被淘汰)
  • 跨层连接(Skip Layer):直接上采样得到的结果是很糙的,需要综合更多的细节信息。(已变成了固定结构)

非常糙的设计

  • 为了保证之后输出的尺寸不至于太小,FCN的作者在第一层直接对原图加了100的padding,可想而知,这会引入噪声。
  • 直接一步从很小的size上采样到和原图相等大小,网格状太明显。

0 人点赞