https://mp.weixin.qq.com/mp/appmsgalbum?__biz=Mzg5MDg4MDU4MQ==&action=getalbum&album_id=2797517475648897028&scene=173&from_msgid=2247485412&from_itemidx=1&count=3&nolastread=1#wechat_redirect
单层神经网络
把一个多元一次方程(需要拟合的目标方程)画为神经网络
神经元:1、x1、x2每个圈为一个神经元
输入层:1、x1、x2整体为输入层,神经网络中输入层永远只有一层,且每个神经元只能有一个特征
输出层:在线性回归中输出层起着加和的作用
正向传播:输入层上每个神经元的特征与对应连线上的权重相乘,最后由输出层汇总结果
手动实现正向传播
代码语言:Python复制import torch
X = torch.tensor([[1,0,0],[1,1,0],[1,0,1],[1,1,1]], dtype = torch.float32)
# tensor([[1., 0., 0.],
# [1., 1., 0.],
# [1., 0., 1.],
# [1., 1., 1.]])
w = torch.tensor([-0.2,0.15,0.15], dtype = torch.float32)
# tensor([-0.2000, 0.1500, 0.1500])
输出层的结果为
代码语言:Python复制zhat=torch.mv(X,w)
# tensor([-0.2000, -0.0500, -0.0500, 0.1000])
torch.nn.Linear实现正向传播
代码语言:Python复制import torch
X = torch.tensor([[0,0],[1,0],[0,1],[1,1]], dtype = torch.float32)
# tensor([[0., 0.],
# [1., 0.],
# [0., 1.],
# [1., 1.]])
torch.random.manual_seed(0)
output = torch.nn.Linear(2,1)
zhat=output(X)
对torch.nn.Linear类实例化,需要输入两个参数,上一层的神经元个数,这一层的神经元个数。因为输入层特征矩阵X只有两个特征,所以上一层的神经元个数=2,这一层是输出层只有一个神经元所以这一层的神经元个数=1
在实例化中,会自动生成神经连接上的权重w和截距b,但因为是随机生成的需要设置随机数,确保每次运行都生成相同的权重w和截距b。
但是因为w和b是随机生成的所以输出层的结果zhat和手动算的不一样,这只是为了演示正向传播过程。神经网络需要通过多次
感知机处理2分类问题
上边的神经网络只能处理回归问题,而不能给出具体的分类,因此需要在输出层增加一个离散函数,根据数值大小把zhat分为不同的分类。
感知机是单层神经网络,输出层使用sign
(阶跃函数、符号函数)对zhat处理,从而得到2分类输出结果
与门问题
与门问题,即X的第二列和第三列取逻辑and得到的结果0,0,0,1,需要用感知机预测这个2分类问题
代码语言:Python复制import torch
X = torch.tensor([[1,0,0],[1,1,0],[1,0,1],[1,1,1]], dtype = torch.float32)
# tensor([[1., 0., 0.],
# [1., 1., 0.],
# [1., 0., 1.],
# [1., 1., 1.]])
w = torch.tensor([-0.2,0.15,0.15], dtype = torch.float32)
输出层的结果为,因为感知机使用的是sign函数,返回的结果是-1和1代表了两个分类,那么这里的-1就是0即False而1代表1即True
代码语言:Python复制zhat = torch.mv(X,w)
# tensor([-0.2000, -0.0500, -0.0500, 0.1000])
output = torch.sign(zhat)
# tensor([-1., -1., -1., 1.])
那么权重w是怎么得到的呢,可以使用梯度下降方法通过迭代找到损失函数最小值,从而得到w