本期视频内容:手写字体识别 MNIST (实战 - 上)
视频地址:http://mpvideo.qpic.cn/0bc32aabyaaavealzndykvrfbugddtiaahaa.f10002.mp4?
专业名词解释
(1)参数与超参数
参数:模型f(x, θ)中的θ 称为模型的参数,可以通过优化算法进行学习。
超参数:用来定义模型结构或优化策略。
(2)batch_size 批处理
每次处理的数据数量。
(3)epoch 轮次
把一个数据集,循环运行几轮。
(4)transforms 变换
主要是将图片转换为tensor,旋转图片,以及正则化。
(5)nomalize 正则化
模型出现过拟合现象时,降低模型复杂度。
(6)卷积层
由卷积核构建,卷积核简称为卷积,也称为滤波器。卷积的大小可以在实际需要时自定义其长和宽(1*1, 3*3, 5*5)。
(7)池化层
对图片进行压缩(降采样)的一种方法,如max pooling, average poolin等。
(8)激活层
激活函数的作用就是,在所有的隐藏层之间添加一个激活函数,这样的输出就是一个非线性函数了,因而神经网络的表达能力更加强大了。
(9)损失函数
在深度学习中,损失反映模型最后预测结果与实际真值之间的差距,可以用来分析训练过程的好坏、模型是否收敛等,例如均方损失、交叉熵损失等。
(10)前向传播
(11)反向传播
参考博文:
https://blog.csdn.net/weixin_38347387/article/details/82936585
(12)梯度下降法