最新 最热

MapReduce经典简答题

在上一个阶段——HDFS,小菌出过一期HDFS的经典面试题,不知道小伙伴们掌握的怎么样吖(详情见–>《HDFS经典面试题》),本期同样在MapReduce快要结束阶段为大家带来MapReduce的经典面试题!...

2021-01-22
0

MapReduce的逻辑切分split与合并combiner

在之前的博客《MapReduce中shuffle阶段概述及计算任务流程》,小菌为大家分享了MapReduce的整体计算任务流程以及shuffle阶段主要的作用。本篇博客小菌将针对MapReduce流程中的第2步——split逻辑切分与第7步——合并...

2021-01-22
0

MapReduce的自定义分区与ReduceTask数量

本篇博客小菌为大家带来的是MapReduce的自定义分区与ReduceTask内容的分享(ReduceMap具体计算流程见《MapReduce中shuffle阶段概述及计算任务流程》)。

2021-01-22
0

MapReduce中shuffle阶段概述及计算任务流程

在小菌上一篇博客《什么是MapReduce(入门篇)》中,小菌已经为大家介绍了MapReduce的相关概念介绍。其中谈到了MapReduce主要由Map和Reduce两个过程组成!事实上,为了让Reduce可以并行处理Map的结果,需要对Map的输出进行...

2021-01-22
0

MapReduce初体验——统计指定文本文件中每一个单词出现的总次数

相信小伙伴们看了小菌上一篇博客《什么是MapReduce(入门篇)》后,对MapReduce的概念有了更深的认知!本篇博客,小菌为大家带来的则是MapReduce的实战——统计指定文本文件中每一个单词出现的总次数。...

2021-01-22
0

什么是MapReduce(入门篇)

在HDFS系列完结之后,小伙伴们期待的MapReduce系列已经在向大家挥手了。本篇博客,小菌将为大家带来MapReduce的入门介绍!

2021-01-22
0

org.apache.hadoop.mapred.FileAlreadyExistsException: Output directory xxxx already exists解决方法

最近开始学习mapreduce。小菌在第一次写mapreduce的时候就遇到了一个新手经常遇到的坑,具体的bug见下图

2021-01-22
0

盘点JavaScript中数组遍历的全部方式(下篇)

JavaScript想必大家都不陌生了,上篇文章盘点JavaScript中数组遍历的全部方式(上篇)已经给大家介绍了7种数组遍历的方式,这篇文章继续介绍7种数组遍历的方式,这样一共14种遍历方式,基本上囊括了JavaScript中全部的数组遍历方...

2021-01-22
0

【大数据哔哔集20210111】HDFS中的常用压缩算法及区别

sequenceFile文件是Hadoop用来存储二进制形式的[Key,Value]对而设计的一种平面文件(Flat File)。可以把SequenceFile当做是一个容器,把所有的文件打包到SequenceFile类中可以高效的对小文件进行存储和处理。SequenceFi...

2021-01-21
0

此流非彼流——Stream详解

Java从8开始,不但引入了Lambda表达式,还引入了一个全新的流式API:Stream API。它位于java.util.stream包中。

2021-01-21
0