小白学PyTorch | 15 TF2实现一个简单的服装分类任务

2020-10-15 14:21:54 浏览数 (1)

【机器学习炼丹术】的学习笔记分享

参考目录:

  • 0 为什么学TF
  • 1 Tensorflow的安装
  • 2 数据集构建
  • 2 预处理
  • 3 构建模型
  • 4 优化器
  • 5 训练与预测

0 为什么学TF

之前的15节课的pytorch的学习,应该是让不少朋友对PyTorch有了一个全面而深刻的认识了吧 (如果你认真跑代码了并且认真看文章了的话)

大家都会比较Tensorflow2和pytorch之间孰优孰劣,但是我们也并不是非要二者选一,两者都是深度学习的工具,其实我们或多或少应该了解一些比较好。就好比,PyTorch是冲锋枪,TensorFlow是步枪,在上战场前,我们可以选择带上冲锋枪还是步枪,但是在战场上,可能手中的枪支没有子弹了,你只能在地上随便捡了一把枪。很多时候,用Pytorch还是Tensorflow的选择权不在自己。

此外,了解了TensorFlow,大家才能更好的理解PyTorch和TF究竟有什么区别。我见过有的大佬是TF和PyTorch一起用在一个项目中,数据读取用PyTorch然后模型用TF构建。

总之,大家有时间有精力的话,顺便学学TF也不亏,更何况TF2.0现在已经优化了很多。本系列预计用3节课来简单的入门一下Tensorflow2.

和PyTorch的第一课一样,我们直接做一个简单的小实战。MNIST手写数字分类,Fashion MNIST时尚服装分类。

1 Tensorflow的安装

安装TensorFlow的方法很简单,就是在控制台执行:

代码语言:javascript复制
pip install tensorflow --user

这里的--user是赋予这个命令执行权限的,一般我都会带上。

2 数据集构建

代码语言:javascript复制
# keras是TF的高级API,用起来更加的方便,一般也是用keras。
import tensorflow as tf
from tensorflow import keras
import numpy as np

导入需要用到的库函数. 正如torchvision.datasets中一样,keras.datasets中也封装了一些常用的数据集。

代码语言:javascript复制
fashion_mnist = keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, test_labels) = fashion_mnist.load_data()
print('train_images shape:',train_images.shape)
print('train_labels shape:',train_labels.shape)
print('test_images shape:',test_images.shape)
print('test_labels shape:',test_labels.shape)

输出结果是:

训练数据集中有60000个样本,每一个样本和MNIST手写数字大小是一样的,是

28times 28

大小的,然后每一个样本有一个标签,这个标签和MNIST也是一样的,是从0到9,是一个十分类任务。

来看一下这些类别有哪些:

标签

类别

标签

类别

0

T-shirt

5

Sandal

1

Trouser

6

Shirt

2

Pullover

7

Sneaker

3

Dress

8

Bag

4

Coat

9

Ankle boot

这里学学单词吧:

  • T-shirt就是T型的衬衫,就是短袖,我感觉前面没有扣子的那种也叫T-shirt;
  • Shirt就是长袖的那种衬衫;
  • Trouser是裤子;
  • pullover是毛衣,套头毛衣,就是常说的卫衣吧感觉;
  • dress连衣裙;
  • coat是外套;
  • sandal是凉鞋;
  • sneaker是运动鞋;
  • ankle boot是短靴,是到脚踝的那种靴子;
  • 这里补充一个吧,sweater,是毛线衣,运动衫,这个和pullover有些类似,个人感觉主要的区分在于运动系列的可以叫做sweater,其他的毛衣卫衣是pullover。

运动短袖T-shirt 运动卫衣sweater是我秋天去健身房的穿搭。

2 预处理

这里不做图像增强之类的了,上面的数据中,图像像素值是从0到255的,我们要把这些标准化成0到1的范围。

代码语言:javascript复制
train_images = train_images / 255.0
test_images = test_images / 255.0

3 构建模型

代码语言:javascript复制
# 模型搭建
model = keras.Sequential([
    keras.layers.Flatten(input_shape=(28, 28)),
    keras.layers.Dense(128, activation='relu'),
    keras.layers.Dense(10, activation='softmax')
])

这就是一个用keras构建简单模型的例子:

  • keras.layers.Flatten是把
28times 28

的二维度拉平成一个维度,因为这里是直接用全连接层而不是卷积层进行处理的;

  • 后面跟上两个全连接层keras.layers.Dense()就行了。我们可以发现,这个全连接层的参数和PyTorch是有一些区别的:
    1. PyTorch的全连接层需要一个输入神经元数量和输出数量torch.nn.Linear(5,10),而keras中的Dense是不需要输入参数的keras.layers.Dense(10)
    2. keras中的激活层直接封装在了Dense函数里面,所以不需要像PyTorch一样单独写一个nn.ReLU()了。

4 优化器

代码语言:javascript复制
model.compile(optimizer='adam',
              loss='sparse_categorical_crossentropy',
              metrics=['accuracy'])

定义优化器和损失函数,在keras中叫做对模型进行编译compile(在C语言中,在运行代码之前都需要对代码进行编译嘛)。损失函数和优化器还有metric衡量指标的设置都在模型的编译函数中设置完成。

上面使用Adam作为优化器,然后损失函数用了交叉熵,然后衡量模型性能的使用了准确率Accuracy。

5 训练与预测

代码语言:javascript复制
model.fit(train_images, train_labels, epochs=10)

这就是训练过程,相比PyTorch而言,更加的简单简洁,但是不像PyTorch那样灵活。

代码语言:javascript复制
test_loss, test_acc = model.evaluate(test_images, test_labels)
print('nTest accuracy:', test_acc)

这个.evaluate方法是对模型的验证集进行验证的,因为本次任务中并没有对训练数据再划分出验证集,所以这里直接使用测试数据了。

大家应该能理解训练集、验证集和测试集的用途和区别吧,我在第二课讲过这个内容,在此不多加赘述。

代码语言:javascript复制
predictions = model.predict(test_images)

这个.predict方法才是用在测试集上,进行未知标签样本的类别推理的。

本次内容到此为止,大家应该对keras和tensorflow有一个直观浅显的认识了。当然tensorflow也有一套类似于PyTorch中的dataset,dataloader的那样自定义的数据集加载器的方法,在后续内容中会深入浅出的学一下。

- END -

0 人点赞