最新 最热

Spark编程技巧

这两个转换都有shuffle过程发生,且都类似map reduce,但是reduceByKey会在map阶段会对相同的key进行聚合,极大的减少了map产生的数据量,进而减少了shuffle的数据量,提高了程序的执行效率...

2022-09-29
0

spark运行方式及其常用参数

yarn cluster模式:spark driver和application master在同一个节点上 yarn client模式:spark driver和client在同一个节点上,支持shell

2022-09-29
0

DistributtedShell的container在所有节点上仅执行一次

博客将主要介绍过程2的实现过程,主要思路是首先获取节点列表,再在申请container时,指定节点。具体过程如下:

2022-09-29
0

Slider简介

来小米实习快两个月了,分配的一个大任务就是调研Slider,下面我简单的描述下Apache下的孵化项目Slider吧

2022-09-29
1

Why Hadoop2

自从Hadoop2出现之后,其迅速取代了Hadoop1的地位,并丰富了Hadoop的应用场景。如果现在有公司使用Hadoop的话,往往直接采用Hadoop2了。

2022-09-29
0

工作常用之Spark调优[二】资源调优

先设定单个 Executor 核数,根据 Yarn 配置得出每个节点最多的 Executor 数量,每个节

2022-09-27
0

工作常用之Spark调优一】

Spark 3.0 大版本发布, Spark SQL 的优化占比将近 50% 。 Spark SQL 取代 Spark Core ,成

2022-09-27
0

Vue3源码01 : 代码管理策略-monorepo

从定义中可以知道,monorepo是一种策略,该策略的具体内容是:多个项目存储在同一个代码仓库中。采用一种策略,肯定是因为该策略具备一些优点。当然,也要认清其缺点。从下面这张图中,我们可以看出,项目代码的组织策略是在实践中...

2022-09-27
0

yarn安装依赖失败_yarn

大家好,又见面了,我是你们的朋友全栈君。 1:使用window+R打开命令行输入: npm i yarn -g 全局安装yarn

2022-09-27
0

如何使用npm安装yarn

/usr/local/nodejs/bin/yarn -> /usr/local/nodejs/lib/node_modules/yarn/bin/yarn.js

2022-09-27
0