最新 最热

探究与解决YARN Container分配过于集中的问题

最近至少有两个粉丝在问浪尖为啥自己资源充足yarn还会将spark的executor集中分配到个别的nodemanager的问题,浪尖起初只是给出了一个参数yarn.scheduler.fair.assignmultiple参数设为false,由于每天到家都是十一点了没...

2021-03-05
1

Hbase Bulkload 原理|面试必备

下面假设我们有一个 CSV 文件,是存储用户购买记录的。它一共有三列, order_id,consumer,product。我们需要将这个文件导入到Hbase里,其中 order_id 作为Hbase 的 row key。...

2021-03-05
0

hadoop之yarn调度

在大数据的生态中,hdfs解决了海量数据的存储问题,mapreduce解决了海量数据的计算问题,而在任务的执行和资源统一管理层面,则是使用yarn进行统一调度。...

2021-03-04
0

hadoop之旅1

mac下安装Hadoop主要是介绍在Mac系统下安装Hadoop的相关步骤,包含:安装包的下载:JDK和``Hadoop`JDK 的安装和配置SSH的配置,实现免密登陆hadoop的安装与配置hadoop集群搭建基于Hadoop2.9.2使用云服务器搭建hadoop集群安装...

2021-03-02
0

Flink 开发生产问题汇总,亲自解决的才是最宝贵的

当一个Flink App背压的时候(例如由外部组件异常引起),Barrier会流动的非常缓慢,导致Checkpoint时长飙升。

2021-02-24
0

正面PK Spark | 几大特性垫定Flink1.12流计算领域真正大规模生产可用

在小编的记忆里,Flink 自从出现在大众视野中,一直在高速迭代。Flink1.10版本之前因为重大功能的缺失(主要是和Hive的兼容性),笔者一直都不推荐直接应用在大规模的生产实践中,可以做小范围内业务尝试。Flink 1.10版本可以...

2021-02-23
0

小姐姐都能听懂的 ​Presto 详解!揭秘 Presto 最佳实践

Presto 最初是由 Facebook 开发的一个分布式 SQL 执行引擎, 它被设计为用来专门进行高速、实时的数据分析,以弥补 Hive 在速度和对接多种数据源上的短板。...

2021-02-08
0

安装Hadoop集群

。。。 查看之前的这篇安装jdk: https://mp.csdn.net/mdeditor/102639879# 保证至少有三个虚拟机,每个虚拟机完成上面操作

2021-02-05
0

Vue3.0入门 + Vant3.0移动端实践(一)

Vue3.0出来了,感觉Vue3.0比2.0好用多啦,且据说性能也有不少的提升,那么今后拥抱Vue3.0吧,会是个趋势。

2021-02-05
0

详解 Flink 容器化环境下的 OOM Killed

本文将解析 JVM 和 Flink 的内存模型,并总结在工作中遇到和在社区交流中了解到的造成 Flink 内存使用超出容器限制的常见原因。由于 Flink 内存使用与用户代码、部署环境、各种依赖版本等因素都有紧密关系,本文主要讨论...

2021-02-04
0