PyTorch使用tensorboardX

2022-09-02 21:19:49 浏览数 (1)

之前用pytorch是手动记录数据做图,总是觉得有点麻烦。学习了一下tensorboardX,感觉网上资料有点杂,记录一下重点。由于大多数情况只是看一下loss,lr,accu这些曲线,就先总结这些,什么images,audios以后需要再总结。


1.安装

有各种方法,docker安装,使用logger.py脚本调用感觉都不简洁。现在的tensorboardX感觉已经很好了,没什么坑。在命令行pip安装即可

!注意! 这玩意虽然在pytorch下,但是其实是内核是 tensorflow里面的board,所以安装之前得先安装 tensorflow

代码语言:javascript复制
pip install tensorboardX

2.调用

代码语言:javascript复制
from tensorboardX import SummaryWriter
writer = SummaryWriter('log')

writer就相当于一个日志,保存你要做图的所有信息。第二句就是在你的项目目录下建立一个文件夹log,存放画图用的文件。刚开始的时候是空的。

训练的循环中,每次写入 图像名称,loss数值, n_iteration

代码语言:javascript复制
writer.add_scalar('Train/Loss', loss.data[0], niter)

验证的循环中,写入预测的准确度即可:

代码语言:javascript复制
writer.add_scalar('Test/Accu', correct/total, niter)

为了看得清楚一点,我把整个train_eval写一起了

代码语言:javascript复制
def train_eval(epoch):
running_loss = 0.0
for i, data in enumerate(trainloader, 0):
inputs, labels = data
inputs, labels = Variable(inputs), Variable(labels)
optimizer.zero_grad()
outputs = net(inputs)
loss = criterion(outputs, labels)
loss.backward()
optimizer.step()
running_loss  = loss.data[0]
#每2000个batch显示一次当前的loss和accu
if i % 2000 == 1999:
print('[epoch: %d, batch: ]] loss: %.3f' %
(epoch   1, i 1, running_loss / 2000))
running_loss = 0.0
print('[epoch: %d, batch: ]] Accu: %.3f' %(epoch   1, i 1, correct/total))

#每10个batch画个点用于loss曲线
if i % 10 == 0:
niter = epoch * len(trainloader)   i
writer.add_scalar('Train/Loss', loss.data[0], niter)

#每500个batch全验证集检测,画个点用于Accu
if i % 500 == 0:
correct = 0
total = 0
for data in testloader:
images, target = data
res = net(Variable(images))
_, predicted = torch.max(res.data, 1)
total  = labels.size(0)
correct  = (predicted == target).sum()
writer.add_scalar('Test/Accu', correct/total, niter)

3.显示

会发现刚刚的log文件夹里面有文件了。在命令行输入如下,载入刚刚做图的文件(那个./log要写完整的路径)

代码语言:javascript复制
tensorboard --logdir=./log

在浏览器输入:

代码语言:javascript复制
http://0.0.0.0:6006/

就可以看到我们做的两个图了

0 人点赞