最新 最热

Hadoop基础教程-第5章 YARN:资源调度平台(5.1 YARN介绍)

YARN的全称是Yet Another Resource Negotiator,意为另一种资源调度者。 从Apache Hadoop 2.0开始, Hadoop包含 YARN。

2022-05-06
1

Hadoop基础教程-第2章 Hadoop快速入门(2.5 WordContent简单应用)

hdfs命令位于bin目录下,通过hdfs dfs -mkdir命令可以创建一个目录。

2022-05-06
0

Hadoop基础教程-第2章 Hadoop快速入门(2.1 Hadoop简介)

(1)2002年10月,Doug Cutting和Mike Cafarella创建了开源网页爬虫项目Nutch。

2022-05-06
1

未来已来:云原生时代(一)云计算如何一步步走来?

这几天我发现一个现象,好多公司、平台已经开始招揽“云原生”领域的人了,这已经不是暗示了,这就是明示了。

2022-05-06
0

还搞不清JS里for..in for...of forEach map各种遍历方式的区别吗

for循环是JS里最简单也是最通用的遍历方式,我们需要知道遍历的次数。 for循环里return,break等关键字都是可以用的

2022-05-05
0

MapReduce与Spark 对比

研究了一段时间,简单对比了二者不同点,也是Spark计算更有MapReduce的原因所在。

2022-04-27
0

ELT优化,让SQL查询飞起来

清晰的反映了Hadoop中MR的执行过程,map端对文件切割输入,reduce端对数据归并输出,shuffle作为MR的心脏,对map端输入的数据进行缓存、分区、排序,保证reduce的数据是有序的。...

2022-04-27
0

一只猪让大数据飞起来

人与人的互联,物与物的互通,人与物的交互~言行动作都产生了很多数据,这些数据对于企业却是弥足珍贵的,在物质充裕的时代,数据信息才是石油。...

2022-04-27
0

大象微分

日常工作中我们常常抱怨:“50万行的数据,Excel打不开了”,更别提在Excel上做过滤,筛选,排序及透视表了。

2022-04-27
0