从零开始深度学习(一):深度学习引言

2020-04-20 16:35:07 浏览数 (1)

文章首发于本人CSDN账号:https://blog.csdn.net/tefuirnever

由于微信不允许外部链接,你需要点击页尾左下角的“阅读原文”,才能访问文中的链接。

1、简介

其实大部分人都是这样的,即便是我们这些技术宅,第一次听到深度学习的时候也是一脸懵逼,觉得很高大上,然而并不知道它到底是干啥的。

关于什么是深度学习,深度学习能做些什么事情?在 deeplearning.ai 的神经网络和深度学习课程中做过介绍。以下是吴恩达老师的原话:

深度学习改变了传统互联网业务,例如如网络搜索和广告,但是深度学习同时也使得许多新产品和企业以很多方式帮助人们,从获得更好的健康关注。

深度学习做的非常好的一个方面就是读取X光图像,除此之外还有生活中的个性化教育,到精准化农业,甚至到驾驶汽车以及其它一些方面。

在接下来的十年中,我认为我们所有人都有机会创造一个惊人的世界和社会,这就是 AI (人工智能)的力量。我希望你们能在创建 AI (人工智能)社会的过程中发挥重要作用。

我认为AI是最新的电力,大约在一百年前,我们社会的电气化改变了每个主要行业,从交通运输行业到制造业、医疗保健、通讯等方面,我认为如今我们见到了 AI 明显的令人惊讶的能量,带来了同样巨大的转变。显然,AI 的各个分支中,发展的最为迅速的就是深度学习。因此现在,深度学习是在科技世界中广受欢迎的一种技巧。

其实只要你一搜深度学习就是各种铺天盖地的新闻和资料,

关于深度学习的用途,现在最熟知的莫过于,用一个深度神经网络进行猫咪辨认,如下图,可以看到两只小猫咪,那么以电脑为首的机器,能不能识别出有几只猫咪,什么品种的猫咪(我太喜欢小猫小狗了)。

2、神经网络

大概了解了深度学习之后,下一个就应该是神经网络了。

我们常常用深度学习这个术语来指训练神经网络的过程。有时它指的是特别大规模的神经网络训练。那么神经网络究竟是什么呢?

让我们从一个房价预测的例子开始讲起。假设你有一个数据集,它包含了六栋房子的信息。所以也就是说,你知道房屋的具体信息,比如面积是多少平方英尺或者平方米,并且知道房屋价格,目标函数是预测房价。

这时,就需要拟合一个根据房屋面积预测房价的函数。如果对线性回归很熟悉,你应该很容易就用这些数据拟合一条直线。

但奇怪的是,你可能也发现了,价格永远不会是负数,也就是等于或者大于0。因此,直线需要弯曲一点并最终在零结束。这条蓝色的手划线就是最终的函数,用于根据房屋面积预测价格。虽然这条直线拟合的不错,但是因为价格永不负数的缘故,你也许会认为这个函数只拟合房屋价格,没啥普适性,偶然性反而更大一些。

把房屋的面积(size)作为神经网络的输入,用表示,通过一个小圆圈,其实这个小圆圈就是一个单独的神经元(neuron),最终输出了价格(price),用表示。到这里网络就实现了左边的功能

剧透一下,在有关神经网络的文献中,你会经常看到这个函数。从趋于零开始,然后变成一条直线,几乎可以说是完全拟合了房屋价格和房屋面积的关系。这个函数被称作 ReLU 激活函数,它的全称是 线性整流函数(Rectified Linear Unit, ReLU),又称 修正线性单元。修正可以理解成 max(0,x),这也是函数这个形状的原因。

至于很多同学担心的数学问题,这里提出了Relu函数,你现在不用担心,之后我们会详细地讲到它。

可以看到我们已经简单地搭建了一个单神经元网络,如果可以的话也可以叫它 神经网络,不管规模的大小,即便只有一个神经元,它也是通过把这些单个神经元叠加在一起来形成一个大的网络。比较经典的类比就是,把这些神经元想象成单独的乐高积木,你就通过搭积木来完成一个更大的神经网络。

下图是神经网络:

下图是乐高积木:

有没有一种相似的感觉???

还是来看刚才的例子,不仅仅用房屋的面积来预测它的价格,还有其他相关房屋特征,比如卧室的数量,家人的数量等等。

在kaggle上有一个经典的竞赛题目就是房价预测,具体说明如下:

可以看到影响最终价格的因素可以很多,甚至高达79个。这些都可以在图上用小圆圈代替,也就是说都可以是 ReLU 的一部分,再或者其它非线性函数的一部分。

对于一个房子来说,这些都是与它息息相关的事情。在这个情景里,除了房屋面积之外,还有比如卧室的数量,邮政编码(交通便利程度),富裕程度等。

神经网络的神奇之处在于,当你实现它之后,你要做的只是输入,就能得到输出,这就成为了一个端到端的系统以实现功能。不过神经网络需要大量的数据,从而精准地从到实现映射函数。这些数据是需要有 label 标注的,也就是监督学习,可能你不知道什么是监督学习,别着急,下一节会讲到的。你会发现神经网络在监督学习的环境下是如此的有效和强大,也就是说你只要尝试输入一个,即可把它映射成,就好像刚才在房价预测中看到的效果,转换成了一个简单数学问题,是不是很棒!

未完待续。。。

参考文章

  • 吴恩达——《神经网络和深度学习》

0 人点赞