如何在CDH集群外配置非Kerberos环境的Gateway节点

2018-07-12 15:25:35 浏览数 (1)

温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。

Fayson的github: https://github.com/fayson/cdhproject

提示:代码块部分可以左右滑动查看噢

1.文档编写目的


在使用CDH集群过程中会遇到在集群外的节点使用Hadoop命令访问集群(如:hdfs、hbase、hive、spark、yarn)等命令操作,这时又不想将该节点添加到CDH集群中管理,本篇文章主要介绍如何在集群外节点不通过CM部署一个Gateway节点。

  • 内容概述

1.部署环境说明

2.部署Gateway节点及测试

3.总结

  • 测试环境

1.CM和CDH版本为5.14.2

2.操作系统为RedHat7.3

3.操作用户root

  • 前置条件

1.Gateway节点与集群网络正常

2.环境说明


集群外节点:

集群环境:

cdh05.fayson.com节点并未添加到CM中;

3.部署Gateway节点


1.将集群的hosts文件同步至该Gateway节点(cdh05.fayson.com)

代码语言:javascript复制
[root@cdh01 ~]# scp /etc/hosts cdh05.fayson.com:/etc/

(可左右滑动)

2.登录集群任意节点,将集群的Java目录拷贝至(cdh05.fayson.com)节点的/usr/java目录下

代码语言:javascript复制
[root@cdh01 conf]# scp -r /usr/java/jdk1.8.0_131/ cdh05.fayson.com:/usr/java/

(可左右滑动)

3.登录CDH集群的任意节点,将/opt/cloudera/parcels目录压缩并拷贝至(cdh05.fayson.com)节点

代码语言:javascript复制
[root@cdh01 parcels]# tar -czvf cdh.tar.gz CDH-5.14.2-1.cdh5.14.2.p0.3/ CDH/
[root@cdh01 ~]# scp -r /opt/cloudera cdh05.fayson.com:/opt/

(可左右滑动)

4.登录(cdh05.fayson.com)节点的服务器上,创建/opt/cloudera/parcels目录,并将cdh.tar.gz解压至该目录下

代码语言:javascript复制
[root@cdh05 ~]# mkdir -p /opt/cloudera/
[root@cdh05 ~]# tar -zxvf cdh.tar.gz -C /opt/cloudera/parcels
[root@cdh05 ~]# ll /opt/cloudera/parcels/

(可左右滑动)

5.在(cdh05.fayson.com)节点上执行如下命令创建服务配置文件存放目录

代码语言:javascript复制
[root@cdh05 ~]# mkdir -p /etc/spark/conf
[root@cdh05 ~]# mkdir -p /etc/hadoop/conf
[root@cdh05 ~]# mkdir -p /et/hbase/conf
[root@cdh05 ~]# mkdir -p /etc/hive/conf

(可左右滑动)

登录CDH集群拥有spark、hadoop、hbase、hive等Gateway节点上将/etc/*/conf目录下的配置文件拷贝至(cdh05.fayson.com)节点相应目录下

代码语言:javascript复制
scp -r /etc/hadoop/conf/* cdh05.fayson.com:/etc/hadoop/conf
scp -r /etc/spark/conf/* cdh05.fayson.com:/etc/spark/conf
scp -r /etc/hbase/conf/* cdh05.fayson.com:/etc/hbase/conf
scp -r /etc/hive/conf/* cdh05.fayson.com:/etc/hive/conf

(可左右滑动)

Spark配置文件:

HBase配置文件:

Hive配置文件:

Hadoop配置文件:

6.配置(cdh05.fayson.com)节点的环境变量

修改/etc/profile配置文件,在文件的末尾增加如下配置:

代码语言:javascript复制
export JAVA_HOME=/usr/java/jdk1.8.0_131
export CDH_HOME=/opt/cloudera/parcels/CDH
export PATH=$CDH_HOME/bin:$PATH

(可左右滑动)

修改后执行如下命令是环境变量生效:

代码语言:javascript复制
[root@cdh05 ~]# source /etc/profile

(可左右滑动)

4.GateWay客户端命令验证


1.执行hadoop命令测试

代码语言:javascript复制
[root@cdh05 ~]# hadoop fs -ls /

(可左右滑动)

hadoop命令执行成功。

2.向集群提交一个MR作业

代码语言:javascript复制
[root@cdh05 ~]# hadoop jar /opt/cloudera/parcels/CDH/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar pi 5 5 

(可左右滑动)

作业执行成功。

3.使用yarn命令查看

代码语言:javascript复制
[root@cdh05 ~]# yarn application --list

(可左右滑动)

Yarn命令执行成功。

4.使用hbase shell访问HBase

代码语言:javascript复制
[root@cdh05 ~]# hbase shell

(可左右滑动)

5.使用hive和beeline访问Hive

代码语言:javascript复制
[root@cdh05 ~]# hive

(可左右滑动)

Beeline访问:

代码语言:javascript复制
[root@cdh05 ~]# beeline 
beeline> !connect jdbc:hive2://cdh01.fayson.com:10000/;principal=hive/cdh01.fayson.com@FAYSON.COM

(可左右滑动)

6.使用Impala-shell访问Hive

代码语言:javascript复制
[root@cdh05 ~]# impala-shell -i cdh03.fayson.com

(可左右滑动)

5.总结


1.配置Gateway节点时需要将各服务的客户端配置文件拷贝至Gateway节点的对应目录下,默认为/etc/{servicename}/conf目录,否则无法访问的CDH集群。

2.配置Gateway节点是需要将集群的/usr/java目录下的JDK拷贝至Gateway节点的对应目录下。

3.配置Gateway环境变量时使用的/opt/cloudera/parcels/CDH/bin目录下的服务命令,使用其他目录下的可能会报错。

提示:代码块部分可以左右滑动查看噢

为天地立心,为生民立命,为往圣继绝学,为万世开太平。 温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。

推荐关注Hadoop实操,第一时间,分享更多Hadoop干货,欢迎转发和分享。

原创文章,欢迎转载,转载请注明:转载自微信公众号Hadoop实操

0 人点赞