图像分类语义特征降维可视化

2022-11-18 16:34:06 浏览数 (2)

T-SNE降维

在我们的CNN中，卷积神经网络用来提取图像的特征，全连接层用来进行线性分类。

在上图中，全连接层最后一层有5个神经元，代表5维的向量，就是原图的语义特征。最后一层是线性分类器，有3个输出头，就是输入的5维特征做了一个线性的分类，这里类似于逻辑回归，但逻辑回归是二分类，这里是多分类。这里重点是这个5维向量，它其实在5维空间中已经是线性可分(有关线性可分的内容可以参考模式识别整理中的感知器算法中的线性可分性)了，随便一个线性分类器就可以将其轻松分类。

如果是像ResNet这种不带全连接层的，

可以用最后一层卷积层接一层GlobalAvgPooling(全局平均池化)，对卷积层输出的各个通道(上图中是4个通道)各自求平均值(上图中，红色通道求红色通道的平均值，绿色通道求绿色通道平均值等等)，这些平均值都是标量，再将这些标量组成一个多维的向量(上图中是4维向量)，就成为了语义特征。再用这多维的语义特征去做线性分类，得到多个类别的logits分数，再通过softmax得到各个分类的后验概率。

模式识别

0 人点赞