最新 最热

CDH和HDP最新下载方法

下载链接版本可以加我qq:871017568。备注来意!资料都是从官网下载的绝对真实可靠哦!

2021-03-30
0

关于CDH集群配置文件目录的问题

写这篇文章的目的是记录下今天办的蠢事,公司业务需求需要扩容集群,新增100多台机器,这批机器之前有装过cdh所以在扩集群之前药清理一些不必要的文件。...

2021-03-25
0

0829-5.15.1-Hive锁表导致CM无法启动异常分析

本文描述了一次CDH集群中,Hive锁表导致集群元数据MySQL的Hive MetaStore锁表,从而引起CM服务中断并且无法重启的异常分析。

2021-03-11
0

0831-5.15.1-ResourceManager卡住导致集群job无法提交异常分析

本文描述了一次因为Zookeeper的异常导致ResourceManager卡住,从而导致集群所有作业无法提交的问题分析和处理。

2021-03-11
0

教程|Cloudera数据科学工作台CDSW之旅

Cloudera数据科学工作台CDSW是一个安全的企业数据科学平台,它使的数据科学家能够通过为其提供自己的分析管道来加快从勘探到生产的工作流程。CDSW使数据科学家能够利用现有的技能和工具(例如Python、R和Scala)在Hadoop集...

2021-03-11
0

CDP私有云基础版用户身份认证概述

对于任何计算环境来讲,身份验证是最基本的安全要求。简单来说,用户和服务必须先向系统证明其身份(身份验证),然后才能在授权范围内使用系统功能。身份验证和授权携手并进,以保护系统资源。授权有多种方式处理,从访问控制列表...

2021-03-09
0

探究与解决YARN Container分配过于集中的问题

最近至少有两个粉丝在问浪尖为啥自己资源充足yarn还会将spark的executor集中分配到个别的nodemanager的问题,浪尖起初只是给出了一个参数yarn.scheduler.fair.assignmultiple参数设为false,由于每天到家都是十一点了没...

2021-03-05
0

一招教你用Kettle整合大数据和Hive,HBase的环境!

上一篇博客《还不会使用大数据ETL工具Kettle,你就真的out了!》博主已经为大家介绍了Kettle简单的使用操作,也确实谈到了后面会出较复杂操作的教程,其中当数与大数据组件之前的一些操作。所以本篇博客,博主为大家带来Kettl...

2021-01-27
0

Hadoop常见组件启动方式汇总(持续更新....)

接触过大数据领域的朋友都知道,Hadoop生态系统十分的庞大,许多组件启动的方式也是不尽相同,今天博主抽空整理了一下大数据生态圈中常见组件的启动方式,也算是为自己巩固了一下基础吧~...

2021-01-27
0

关于Zookeeper一键启动/关闭脚本所产生的乌龙事件

大家都知道在Hadoop集群开启/关闭Zookeeper集群的时候,需要到不同的节点ZK的bin目录下执行对应的启动/关闭脚本,十分的麻烦。所以就有了以下脚本的产生~...

2021-01-27
0