今天分享卷积神经网络模型,前面几篇文章介绍的是多层感知机神经网络模型,随着深度学习,卷积神经网络变得流行,尤其是在图像领域,只要是在图像处理的任务中,卷积神经网络比任何其他神经网络要好。
卷积操作
- 卷积核/滤波器/Feature Map : 3 * 3
- 步长(strides): (1, 1)
通过上面的图片可以直观的理解什么是卷积,卷积是源于图像领域的,图像领域输入就是一个图像,最简单的就可以看做一个二维矩阵,中间小方块就是卷积核,在滤波领域叫滤波器。它会不断的从输入的图像里边一点点覆盖,一点点挪动,这里步长1个单位,最右侧一块就是卷积,这个卷积在这个图像上进行一次卷积得到的结果。输入和中间小方块对应的数值进行相乘然后进行相加,得到左边小方块。
Max pooling (池化)
- 池化核 : 3 * 3
- 步长(strides): (3, 3)
卷积的操作一般定义为以每个点每个像素为中心覆盖一部分,对这个覆盖的部分进行加权和的计算得到结果,但是如果对一个图像来说边缘的点来怎么样计算呢?
卷积操作的边缘处理
边缘一侧有值一侧没有值,第一种叫valid,另一种叫same,valid是处理边缘里边,不存在边缘问题。same存在边缘处理问题,通过扩展填充边缘,通过填充让输入和输出长度一样,same是怎样来的呢?我的理解是这样的,因为他是填充的,每个边缘节点都会参与到卷积,输入是几个,移动步伐是1,输出就是几个,输入和输出长度是一样的。valid由于不对边缘节点进行计算,输入和输出大小不一样,输出长度往往小一些。
卷积的过程其实就是用比图片更小的图片去不停的覆盖不停的计算,得到一个新的图片的过程,卷积往往和polling一起使用。
小结
- 通过对图片二维卷积的直观印象理解了卷积的过程。
- Pooling操作和边界处理。