Yann LeCun教授在Twitter上点赞的B站视频 -- 留言送最新机器学习书

2022-07-12 14:49:18 浏览数 (1)

每天给你送来NLP技术干货!


来自:机器之心

编辑:杜伟

神奇的红石,神奇的我的世界,不可思议的 UP 主。

在我的世界(Minecraft)中,红石是一种非常重要的物品。它是游戏中的一种独特材料,开关、红石火把和红石块等能对导线或物体提供类似电流的能量。

红石电路可以为你建造用于控制或激活其他机械的结构,其本身既可以被设计为用于响应玩家的手动激活,也可以反复输出信号或者响应非玩家引发的变化,如生物移动、物品掉落、植物生长、日夜更替等等。

因此,在我的世界中,红石能够控制的机械类别极其多,小到简单机械如自动门、光开关和频闪电源,大到占地巨大的电梯、自动农场、小游戏平台甚至游戏内建的计算机。

近日,B 站 UP 主 @辰占鳌头等人在我的世界中实现了真正的「红石人工智能」,他们耗时六个月,构建了世界上首个纯红石神经网络,任务是识别 15×15 手写数字

作者表示,他们使用非传统的计算方式——随机计算来实现神经网络,在设计和布局上比传统全精度计算简单许多,并且单次理论识别时间仅为 5 分钟。

这个纯红石神经网络完成了机器学习领域常见的图像识别任务——手写数字识别,并且准确率达到了 80%(在 MNIST 数据集上模拟)。

‍在实现的过程中,作者使用到的各种元素包括如下:

单个神经元接受多个输入并产生一个输出。

加入「乘法器」,仅使用随机数和单个逻辑门运算小数乘法。

神经元阵列输出识别结果或传递到下一层。

各数字的置信度。

卷积层用来提取笔画特征。

全连接第一层:压缩信息并分类。

激活函数阵列:将数据非线性地映射到高维特征空间。

全连接第二、三层:进一步分类并输出识别结果。

作者表示,该网络使用的架构是压缩的 LeNet-5,准确率达到 80%。

不过,受限于 Minecraft 的运算能力,实际识别时间超过 20 分钟。尽管如此,这仍是红石数电领域的重大突破,也可能启发现实中的硬件神经网络。

目前,视频的播放量已经超过 80 万,全 B 站排行榜最高第 39 名,让各路网友叹为观止。就连图灵奖得主 Yann LeCun 也在 Facebook 上转发了该视频,表示「一位非常有耐心且坚持不懈的人使用红石在我的世界中实现了 LeNet-5。」LeCun 是 LeNet 架构提出者。

【Minecraft】世界首个纯红石神经网络!真正的红石人工智能(中文/English)

【Minecraft】红石卷积神经网络——原理

背后的原理

在另外一个视频《【Minecraft】红石卷积神经网络——原理》中,作者详细解释了红石卷积神经网络的原理。

总的来说,他们使用的是压缩的 LeNet-5 卷积神经网络,卷积是网络的第一步计算,使用一个带权重的窗口(卷积核)逐次扫描图像并提取笔画特征。

然后将这些笔画特征馈入到深度神经网络(全连接层)进行分类识别。

在我的世界中实现红石神经网络

作者首先列出了输入设备,包括一个单脉冲式压力板手写板和 15×15 坐标屏。其中手写板每次产生 2tick 的坐标信号,接着由屏幕绘制。

随后输入的手写数字进入卷积层,计算方法是累加卷积核被遮盖的部分,并将结果输出到下一层。并且,为了保证非线性,输出还经过了 ReLU 函数。

由于卷积核只有 3×3,因而作者直接使用了电模运算,并在输出端自动进行 ReLU。

‍另外,又由于卷积无法像动画里那样移动,所以采用了直接堆叠的方式,再通过硬连线连接到手写板输入上。

到了全连接层,它的每层由若干神经网络构成。每个神经元都连接多个输入,并产生一个输出。神经元将每个输入加权累加,然后带入一个激活函数输出。

需要注意的是,加权求和是「线性分割」,而激活函数一定是非线性的,用于提升维度。作者使用了 tanh(双曲正切)作为了激活函数

反映到实际的神经元电路中,如下图所示。

同时,权重被储存在投掷器(用来调整物品配比生成不同频率的随机串)中,输入乘以权重后通过模电累加。

最终电路实现

关于电路实现,首先通过模电计算加法,然后转为数电信号。

累加器则是改装了另一位 Up 主提供的 2tick 流水线加法器,使之不会溢出。

接着堆叠神经元,构成一个全连接层。

‍最后一层的输出以及层间缓存使用如下模电计数器,它可以统计 5Hz 串中「1」的数量,容量则为 1024。

最后在输出层,计数器的高 4 位被连接到计数板上,然后电路选取最大的值并在输出面板上显示。

‍视频最后,作者展示了最终的网络结构,如下图所示。其中,权重范围为 [-1, 1],随机串长度为 1024,MNIST 数据集上的准确率约为 80%。不过当串长为 256 时,准确率仅为 62%。

送本书

本书分为13章,前7章为原理篇,重点讨论了机器学习模型建模的全部流程、各类常用的机器学习算法原理、深度学习和强化学习、机器学习涉及的优化原理,以及自然语言处理算法原理;后6章为实践篇,重点讨论了信用卡客户细分、保险公司时间序列生活事件预测、电商网站交易欺诈预测、信用卡和信用贷款风险预测、美国旧金山房屋成交价格预测,以及股票短期回报率预测等多个实际应用场景。

获取方式

在下面认真留言即可

2022.7.11 20:00截止

点赞前五名获取


0 人点赞