最新 最热

大数据框架发展史

这几年大数据的飞速发展,出现了很多热门的开源社区,其中著名的有 Hadoop、Storm,以及后来的 Spark,他们都有着各自专注的应用场景。Spark 掀开了内存计算的先河,也以内存为赌注,赢得了内存计算的飞速发展。Spark 的火热或多...

2021-10-21
0

一起揭开 YARN 的神秘面纱

我们知道MapReduce1.0,是把计算框架和资源调度框架都弄在一起了,所以Master端的JobTracker会大包大揽去执行任务,存在很多问题,比如资源分配不均、单点故障会导致整个集群不可用、没办法集成多个不同的计算框架(比如Spark...

2021-10-19
1

Wiztalk | 122期 陈果《MapReduce 分布式计算框架》

在教育部高等教育司的指导下,Wiztalk在2020年发布了一批教育部产学协同育人项目,面向有计算机科普工作经验的高校老师开放,将应用型的信息技术领域成果形成系列信息技术通识课程。 接下来内容为陈果老师作品,希望对各位读...

2021-10-18
0

React核心 -- React-Hooks

第二个参数接收一个数组,用来表示需要追踪的变量,依赖列表,只有依赖更新的时候才会更新内容

2021-10-15
0

大数据之Hadoop企业级生产调优手册(下)

注:演示纠删码和异构存储需要一共 5台虚拟机。尽量拿另外一套集群。提前准备 5台服务器的集群。

2021-10-13
0

Hadoop重点难点:可靠性/Failover/Shuffle

对Map的结果进行排序并传输到Reduce进行处理 Map的结果并不是直接存放到硬盘,而是利用缓存做一些预排序处理 Map会调用Combiner,压缩,按key进行分区、排序等,尽量减少结果的大小 每个Map完成后都会通知Task,然后Reduce就...

2021-10-12
0

2021年大数据HBase(五):HBase的相关操作-JavaAPI方式!【建议收藏】

因为缴费明细的数据记录非常庞大,该公司的信息部门决定使用HBase来存储这些数据。并且,他们希望能够通过Java程序来访问这些数据。

2021-10-11
1

2021年大数据HBase(十五):HBase的Bulk Load批量加载操作

很多时候,我们需要将外部的数据导入到HBase集群中,例如:将一些历史的数据导入到HBase做备份。我们之前已经学习了HBase的Java API,通过put方式可以将数据写入到HBase中,我们也学习过通过MapReduce编写代码将HDFS中的数据导...

2021-10-11
1

2021年大数据Hadoop(十六):MapReduce计算模型介绍

MapReduce思想在生活中处处可见。或多或少都曾接触过这种思想。MapReduce的思想核心是“分而治之”,适用于大量复杂的任务处理场景(大规模数据处理场景)。即使是发布过论文实现分布式计算的谷歌也只是实现了这种思想,而不...

2021-10-11
0

2021年大数据Hadoop(十七):MapReduce编程规范及示例编写

MapReduce 的开发一共有八个步骤, 其中 Map 阶段分为2个步骤,Shuffle 阶段 4 个步骤,Reduce 阶段分为2个步骤

2021-10-11
0