最新 最热

Yarn快速入门系列(1)——基本架构与三大组件介绍

本篇博客,博主为大家分享的内容是关于一个在Hadoop中非常重要的组件——Yarn。到底有多重要呢?请看下面详解! 码字不易,先赞后看! Apache Hadoop YARN1. Yarn 通...

2021-01-27
1

如何 debug Hive 源码,知其然知其所以然

最近在出差,客户现场的 HiveServer 在很长时间内不可用,查看 CM 的监控发现,HiveServer 的内存在某一时刻暴涨,同时 JVM 开始 GC,每次 GC 长达 1 分钟,导致很长时间内,整个 HiveServer 不可用。...

2021-01-27
1

Pig启动出现Unhandled internal error. jline.Terminal.getTerminal()Ljline/Terminal

根据命令行的提示,我们打开bug所记录的日志。 vim /etc/profile.d/pig_1582816803489.log

2021-01-27
1

Spark之【数据读取与保存】详细说明

Spark的数据读取及数据保存可以从两个维度来作区分:文件格式以及文件系统。文件格式分为:Text文件、Json文件、Csv文件、Sequence文件以及Object文件;文件系统分为:本地文件系统、HDFS、HBASE以及数据库。...

2021-01-27
1

Spark之【RDD编程】详细讲解(No3)——《Action行动算子》

本篇博客是Spark之【RDD编程】系列第三篇,为大家带来的是Action的内容。

2021-01-27
1

教你如何轻松配置Spark的历史日志服务器JobHistoryServer?

默认情况下,Spark程序运行完毕关闭窗口之后,就无法再查看运行记录的Web UI(4040)了,但通过 HistoryServer 可以提供一个服务, 通过读取日志文件, 使得我们可以在程序运行结束后, 依然能够查看运行过程。本篇博客,博主就为...

2021-01-27
1

Spark环境搭建——on yarn集群模式

本篇博客,Alice为大家带来关于如何搭建Spark的on yarn集群模式的教程。

2021-01-27
1

Spark基础环境搭建——local本地模式

提前声明: 1.我们选择目前企业中使用最多的稳定版Spark2.2.0

2021-01-27
1

带你深入浅出,彻底了解什么是Spark?

大数据专业,或者人工智能,深度学习方向的小伙伴们一定对Spark这个名词不陌生吧~不认识也没有关系,今天Alice为大家带来关于Spark的一个详细介绍。

2021-01-27
1

解决Hive启动失败Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient

今天在使用Hadoop集群上的Hive时,结果出现了以下的情况。 hive (default)> show databases; FAILED: SemanticException org.apache.hadoop.hive.ql.metadata.HiveException: java.lang.Runtime......

2021-01-27
1