在之前的博客《MapReduce中shuffle阶段概述及计算任务流程》,小菌为大家分享了MapReduce的整体计算任务流程以及shuffle阶段主要的作用。本篇博客小菌将针对MapReduce流程中的第2步——split逻辑切分与第7步——合并...
在小菌上一篇博客《什么是MapReduce(入门篇)》中,小菌已经为大家介绍了MapReduce的相关概念介绍。其中谈到了MapReduce主要由Map和Reduce两个过程组成!事实上,为了让Reduce可以并行处理Map的结果,需要对Map的输出进行...
最近开始学习mapreduce。小菌在第一次写mapreduce的时候就遇到了一个新手经常遇到的坑,具体的bug见下图
JavaScript想必大家都不陌生了,上篇文章盘点JavaScript中数组遍历的全部方式(上篇)已经给大家介绍了7种数组遍历的方式,这篇文章继续介绍7种数组遍历的方式,这样一共14种遍历方式,基本上囊括了JavaScript中全部的数组遍历方...
sequenceFile文件是Hadoop用来存储二进制形式的[Key,Value]对而设计的一种平面文件(Flat File)。可以把SequenceFile当做是一个容器,把所有的文件打包到SequenceFile类中可以高效的对小文件进行存储和处理。SequenceFi...