论文阅读: 1411.FCN

2021-12-06 21:37:09 浏览数 (2)

1411.4038：Fully Convolutional Networks for Semantic Segmentation

深度学习应用于图像语义分割的开山之作（难免效果很糙），CVPR2015 Best Paper。

创新点

卷积化（Convolutional）: 丢弃全连接，换成卷积层。（已变成了固定结构）
- 分类使用的网络通常会在最后连接几层全连接层，它会将原来二维的矩阵（图片）压扁成一维的，从而丢失了空间信息，最后训练输出一个标量（分类标签）。
- 而图像语义分割的输出需要是个分割图，且不论尺寸大小，但是至少是二维的。所以，我们需要丢弃全连接层，换上全卷积层，而这就是全卷积网络了。
反卷积（Deconvolution）：为了上采样得到和原图等大的分割图。（deconv已被淘汰）
跨层连接（Skip Layer）：直接上采样得到的结果是很糙的，需要综合更多的细节信息。（已变成了固定结构）

非常糙的设计

为了保证之后输出的尺寸不至于太小，FCN的作者在第一层直接对原图加了100的padding，可想而知，这会引入噪声。
直接一步从很小的size上采样到和原图相等大小，网格状太明显。

layer padding size

0 人点赞