我们来向https://ymiir.top/index.php/2022/02/05/cnn_study_1/文章中的神经网络加入池化层,体验池化层带来的效果,网络中使用最大池化,且设置ceil_mode为True。
代码语言:javascript复制#import一系列依赖库
import torch
from PIL import Image
from tensorboardX import SummaryWriter
from torch import nn
from torch.utils.data import Dataset, DataLoader
import os
from torchvision import transforms
import torch.nn.functional as F
#定义的transforms对象,后面对图像进行变换时使用
#神经网络要求喂入的数据格式是tensor
#trans将PIL格式的image转化成为tensor格式的image
trans=transforms.ToTensor()
#神经网络要求喂入的数据图像大小一致
#我们./dataset/train/ants文件夹下
#图像大小不一致,需要将尺寸一致调为[3,375,500]
trans_re=transforms.Resize([375,500])
#首先创建自己的数据集
#我们的数据是存放在"./dataset/train/ants"下的蚂蚁照片
#定义自己的数据集类
class MyDataset(Dataset):
def __init__(self,root_dir,label_dir):
self.root_dir=root_dir
self.label_dir=label_dir
self.path=os.path.join(self.root_dir,self.label_dir)
self.img_list=os.listdir(self.path)
def __getitem__(self, item):
#通过索引获取图片名称
img_name=self.img_list[item]
#拼接得到图像路径
img_path=os.path.join(self.path,img_name)
#打开图片,得到的图片格式是PIL格式的
img=Image.open(img_path)
#transforms的resize对象
#要求输入为PIL格式,因此首先改变图像大小
img=trans_re(img)
#将图片转变为tensor格式
img=trans(img)
label=self.label_dir
#返回一对(数据,标签)
return img,label
def __len__(self):
return len(self.img_list)
#实例化数据集对象,传入路径
#得到数据集
mydataset=MyDataset('dataset/train','ants')
#dataloader将数据集分为
#一个一个batch,便于喂入神经网络
#这里的batch大小为16
dataloader=DataLoader(dataset=mydataset,batch_size=16)
#定义神经网络类
class MyModel(nn.Module):
def __init__(self):
super(MyModel, self).__init__()
#添加卷积层,输入3通道图像
#输出3通道图像,卷积核大小为3*3
#上下步长为1,四周增加padding为1
self.conv=torch.nn.Conv2d(3,3,(3,3),padding=1)
#添加池化层,池化核尺寸为3*3,ceil_mode设置为True
self.pooling=torch.nn.MaxPool2d(3,ceil_mode=True)
#前向传播函数
def forward(self,x):
#输入数据通过卷积,池化,并使用relu激活函数
#返回输出的数据
output=self.conv(x)
return F.relu(self.pooling(output))
#创建神经网络对象
model=MyModel()
#日志存入./test文件夹
writer=SummaryWriter('./test001')
#tensorboard可以将多个图像
#组合在一起输出,分为多个step(0,1,2,...)
#便于得知训练中每个阶段网络的输出
step=0
#遍历dataloader中的batch
#分batch喂入数据集
for data in dataloader:
#获取一组图像,一组标签
#我们这里只对图像进行处理观察效果
#实际上label无用
imgs,label=data
#图像经过神经网络处理得到输出
output=model(imgs)
#绘制处理之前的图像,每16(batch_size)张一组
writer.add_images('原图',imgs,step)
##绘制处理之后的图像,每16(batch_size)张一组
writer.add_images('后来',output,step)
#step递增
step=step 1
程序的运行结果:
同样是step3中的图像,与之前仅有卷积层的结果相比,图像显著变小,看起来更加模糊,简化了网络计算复杂度,进行特征压缩,提取了主要特征。