1411.4038:Fully Convolutional Networks for Semantic Segmentation
深度学习应用于图像语义分割的开山之作(难免效果很糙),CVPR2015 Best Paper。
创新点
- 卷积化(Convolutional): 丢弃全连接,换成卷积层。(已变成了固定结构)
- 分类使用的网络通常会在最后连接几层全连接层,它会将原来二维的矩阵(图片)压扁成一维的,从而丢失了空间信息,最后训练输出一个标量(分类标签)。
- 而图像语义分割的输出需要是个分割图,且不论尺寸大小,但是至少是二维的。所以,我们需要丢弃全连接层,换上全卷积层,而这就是全卷积网络了。
- 反卷积(Deconvolution):为了上采样得到和原图等大的分割图。(deconv已被淘汰)
- 跨层连接(Skip Layer):直接上采样得到的结果是很糙的,需要综合更多的细节信息。(已变成了固定结构)
非常糙的设计
- 为了保证之后输出的尺寸不至于太小,FCN的作者在第一层直接对原图加了100的padding,可想而知,这会引入噪声。
- 直接一步从很小的size上采样到和原图相等大小,网格状太明显。