最新 最热

聊聊elasticsearch的MembershipAction

elasticsearch-6.7.1/server/src/main/java/org/elasticsearch/discovery/zen/MembershipAction.java

2019-05-10
0

SparkStreaming如何解决小文件问题

使用sparkstreaming时,如果实时计算结果要写入到HDFS,那么不可避免的会遇到一个问题,那就是在默认情况下会产生非常多的小文件,这是由sparkstreaming的微批处理模式和DStream(RDD)的分布式(partition)特性导致的,sparkstre...

2019-05-09
0

Facebook最新论文:跨语言模型预训练,三大任务刷新最高性能

最近的研究已经证明,生成式预训练对于英语自然语言理解很有效。但该领域的研究基本上都是单语的,主要集中在英语。

2019-05-08
1

74.7秒训练完ImageNet!刷新记录,2048 GPU暴力出奇迹

在过去两年中,深度学习的速度加速了 30 倍。但是人们还是对 “快速执行机器学习算法” 有着强烈的需求。

2019-05-08
0

BERT训练猛提速!谷歌新研究将BERT预训练时间从3天缩短到76分钟

BERT 在 33 亿文本的语料上训练语言模型,再分别在不同的下游任务上微调,在11个不同的 NLP 任务均得到了目前为止最好的结果。

2019-05-08
0

[ 后端篇 ] 09 - AWS DynamoDB Pagination(分页)

当数据量过多的时候,往往数据不能全部读取,需要进行分页读取,可以看到到DynamoDB API接口的限制:

2019-05-07
0

Google:数据并行对神经网络训练用时的影响

近年来,硬件的不断发展使数据并行计算成为现实,并为加速神经网络训练提供了解决方案。为了开发下一代加速器,最简单的方法是增加标准 minibatch 神经网络训练算法中的 batch size。在这篇论文中,我们的目标是通过实验表征...

2019-05-06
1

刷新纪录 | 74.7 秒训练完 ImageNet!2048 GPU 暴力出奇迹

在过去两年中,深度学习的速度加速了 30 倍。但是人们还是对 “快速执行机器学习算法” 有着强烈的需求。

2019-05-05
0

Flume 在有赞大数据的实践

Flume 在有赞的大数据业务中一直扮演着一个稳定可靠的日志数据“搬运工”的角色。本文主要讲一下有赞大数据部门在 Flume 的应用实践,同时也穿插着我们对 Flume 的一些理解。...

2019-04-29
0

小样本学习(Few-shot Learning)综述

笔者所在的阿里巴巴小蜜北京团队就面临这个挑战。我们打造了一个智能对话开发平台——Dialog Studio,以赋能第三方开发者来开发各自业务场景中的任务型对话,其中一个重要功能就是对意图进行分类。大量平台用户在创建一...

2019-04-29
1