「@Author:Runsen」
上次介绍了顺序模型,但是在大多数情况下,我们基本都是以类的形式实现神经网络。
大多数情况下创建一个继承自 Pytorch
中的 nn.Module
的类,这样可以使用 Pytorch 提供的许多高级 API,而无需自己实现。
下面展示了一个可以从nn.Module
创建的最简单的神经网络类的示例。基于 nn.Module
的类的最低要求是覆盖__init__()
方法和forward()
方法。
在这个类中,定义了一个简单的线性网络,具有两个输入和一个输出,并使用 Sigmoid()
函数作为网络的激活函数。
import torch
from torch import nn
class LinearRegression(nn.Module):
def __init__(self):
#继承父类构造函数
super(LinearRegression, self).__init__()
#输入和输出的维度都是1
self.linear = nn.Linear(1, 1)
def forward(self, x):
out = self.linear(x)
return out
现在让我们测试一下模型。
代码语言:javascript复制# 创建LinearRegression()的实例
model = LinearRegression()
print(model)
# 输出如下
LinearRegression(
(linear): Linear(in_features=1, out_features=1, bias=True)
)
现在让定义一个损失函数和优化函数。
代码语言:javascript复制model = LinearRegression()#实例化对象
num_epochs = 1000#迭代次数
learning_rate = 1e-2#学习率0.01
Loss = torch.nn.MSELoss()#损失函数
optimizer = torch.optim.SGD(model.parameters(), lr=learning_rate)#优化函数
我们创建一个由方程
产生的数据集,并通过
函数制造噪音
代码语言:javascript复制import torch
from matplotlib import pyplot as plt
from torch.autograd import Variable
from torch import nn
# 创建数据集 unsqueeze 相当于
x = Variable(torch.unsqueeze(torch.linspace(-1, 1, 100), dim=1))
y = Variable(x * 2 0.2 torch.rand(x.size()))
plt.scatter(x.data.numpy(),y.data.numpy())
plt.show()
关于torch.unsqueeze
函数解读。
>>> x = torch.tensor([1, 2, 3, 4])
>>> torch.unsqueeze(x, 0)
tensor([[ 1, 2, 3, 4]])
>>> torch.unsqueeze(x, 1)
tensor([[ 1],
[ 2],
[ 3],
[ 4]])
遍历每次epoch,计算出loss,反向传播计算梯度,不断的更新梯度,使用梯度下降进行优化。
代码语言:javascript复制for epoch in range(num_epochs):
# 预测
y_pred= model(x)
# 计算loss
loss = Loss(y_pred, y)
#清空上一步参数值
optimizer.zero_grad()
#反向传播
loss.backward()
#更新参数
optimizer.step()
if epoch % 200 == 0:
print("[{}/{}] loss:{:.4f}".format(epoch 1, num_epochs, loss))
plt.scatter(x.data.numpy(), y.data.numpy())
plt.plot(x.data.numpy(), y_pred.data.numpy(), 'r-',lw=5)
plt.text(0.5, 0,'Loss=%.4f' % loss.data.item(), fontdict={'size': 20, 'color': 'red'})
plt.show()
####结果如下####
[1/1000] loss:4.2052
[201/1000] loss:0.2690
[401/1000] loss:0.0925
[601/1000] loss:0.0810
[801/1000] loss:0.0802
代码语言:javascript复制[w, b] = model.parameters()
print(w,b)
# Parameter containing:
tensor([[2.0036]], requires_grad=True) Parameter containing:
tensor([0.7006], requires_grad=True)
这里的b=0.7,等于0.2 torch.rand(x.size())
,经过大量的训练torch.rand()
一般约等于0.5。