最新 最热

实时计算双星-Flink VS Spark 部署模式对比

本文主要对Flink和Spark集群的standalone模式及on yarn模式进行分析对比。Flink与Spark的应用调度和执行的核心区别是Flink不同的job在执行时,其task同时运行在同一个进程TaskManager进程中;Spark的不同job的task执行时...

2020-06-28
0

全栈的自我修养: 001环境搭建 (使用Vue,Spring Boot,Flask 完成Vue前后端分离开发)

本系列文章将从一个完整的项目是如何开发的过程进行编写,期间会涉及前端、后端和一些运维的知识。

2020-06-28
0

spark stream配置log输出

在cluster模式下,spark-submit添加如下参数。两个--conf分别为driver和executor设置log4j的配置文件,--files将文件上传到集群

2020-06-23
0

win10环境下使用npm安装yarn

npm的bin地址进入cmd:npm -g binyarn安装命令:npm i -g yarnnpm i -g yarn yarn安装路径,并且配置到用户变量中,然后重启电脑(不一定)、

2020-06-23
0

0785-基于CDP7.1.1的Spark3.0技术预览版本发布

今天Cloudera正式宣布发布CDS3,基于Apache Spark 3.0 preview2 release,参考:

2020-06-19
0

yarn-site.xml 配置介绍

yarn-site.xml 配置介绍yarn.scheduler.minimum-allocation-mb yarn.scheduler.maximum-allocation-mb说明:单个容器可申请的最小与最大内存,应用在运行申请内存时不能超过最大值,小于最小值则分配最小值,从这个角度看,最...

2020-06-19
0

分享我在前后端分离项目中Gitlab-CI的经验

之前我分享了为ASP.NET Core后端搭建Gitlab-CI/CD实践,今天继续聊一聊为

2020-06-16
0

004.CM大数据平台实践之常用组件安装

每安装完一个组件之后,CM很能会提示某些过期配置需要重启,那么重启服务即可,最终的集群状态如下:

2020-06-16
0

Yarn模式下的监控界面介绍

有yarn-client和yarn-cluster两种模式,主要区别在于:Driver程序的运行节点不同。

2020-06-12
0

【数据分析丨主题周】Spark四大特征分析介绍

Spark是一种基于内存的、分布式的、大数据处理框架,在 Hadoop 的强势之下,Spark凭借着快速、简洁易用、通用性以及支持多种运行模式四大特征,冲破固有思路成为很多企业标准的大数据分析框架。...

2020-06-11
0