图像分类语义特征降维可视化

2022-11-18 16:34:06 浏览数 (1)

T-SNE降维

在我们的CNN中,卷积神经网络用来提取图像的特征,全连接层用来进行线性分类。

在上图中,全连接层最后一层有5个神经元,代表5维的向量,就是原图的语义特征。最后一层是线性分类器,有3个输出头,就是输入的5维特征做了一个线性的分类,这里类似于逻辑回归,但逻辑回归是二分类,这里是多分类。这里重点是这个5维向量,它其实在5维空间中已经是线性可分(有关线性可分的内容可以参考模式识别整理 中的感知器算法中的线性可分性)了,随便一个线性分类器就可以将其轻松分类。

如果是像ResNet这种不带全连接层的,

可以用最后一层卷积层接一层GlobalAvgPooling(全局平均池化),对卷积层输出的各个通道(上图中是4个通道)各自求平均值(上图中,红色通道求红色通道的平均值,绿色通道求绿色通道平均值等等),这些平均值都是标量,再将这些标量组成一个多维的向量(上图中是4维向量),就成为了语义特征。再用这多维的语义特征去做线性分类,得到多个类别的logits分数,再通过softmax得到各个分类的后验概率。

0 人点赞