最新 最热

2021年大数据Spark(三十五):SparkStreaming数据抽象 DStream

Spark Streaming的核心是DStream,DStream类似于RDD,它实质上一系列的RDD的集合,DStream可以按照秒、分等时间间隔将数据流进行批量的划分。

2021-10-09
0

2021年大数据Spark(三十六):SparkStreaming实战案例一 WordCount

从TCP Socket数据源实时消费数据,对每批次Batch数据进行词频统计WordCount,流程图如下:

2021-10-09
0

别魔改网络了,Google研究员:模型精度不高,是因为你的Resize方法不够好!

尽管近年来卷积神经网络很大地促进了计算机视觉的发展,但一个重要方面很少被关注:图像大小对被训练的任务的准确性的影响 。在本文介绍了一篇谷歌在ICCV2021的工作,作者提出了一个可学习的调整器模型(resizer model)来提高...

2021-10-09
0

Batch Renormalization:修复小批量对Batch Normalization的影响

这篇论文也是batch normalization的作者所写的,主要是针对小的mini-batch 会影响normalization效果这个问题作出修复,如果你的BN效果不好,可以试试这个方法。...

2021-10-09
0

深度学习:梯度下降算法改进

深度学习难以在大数据领域发挥最大效果的一个原因是,在巨大的数据集基础上进行训练速度很慢。而优化算法能够帮助我们快速训练模型,提高计算效率。接下来我么就去看有哪些方法能够解决我们刚才遇到的问题或者类似的问题...

2021-10-09
0

BN与神经网络调优

我们经常会涉及到参数的调优,也称之为超参数调优。目前我们从第二部分中讲过的超参数有

2021-10-09
0

[源码解析] PyTorch 流水线并行实现 (4)--前向计算

前几篇文章我们介绍了 PyTorch 流水线并行的基本知识,自动平衡机制和切分数据,本文我们结合论文内容来看看如何保证前向计算执行顺序。

2021-10-09
0

Huggingface

从这一集,我们就正式开始使用Transformer来训练模型了。今天的部分是关于数据集预处理。

2021-10-08
0

【面试题】1085- setState 到底是同步的,还是异步的

这是一道变体繁多的面试题,在 BAT 等一线大厂的面试中考察频率非常高。首先题目会给出一个这样的 App 组件,在它的内部会有如下代码所示的几个不同的 setState 操作:...

2021-10-08
1