温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。
Fayson的github: https://github.com/fayson/cdhproject
提示:代码块部分可以左右滑动查看噢
1.文档编写目的
在使用CDH集群过程中会遇到在集群外的节点使用Hadoop命令访问集群(如:hdfs、hbase、hive、spark、yarn)等命令操作,这时又不想将该节点添加到CDH集群中管理,本篇文章主要介绍如何在集群外节点不通过CM部署一个Gateway节点。
- 内容概述
1.部署环境说明
2.部署Gateway节点及测试
3.总结
- 测试环境
1.CM和CDH版本为5.14.2
2.操作系统为RedHat7.3
3.操作用户root
- 前置条件
1.Gateway节点与集群网络正常
2.环境说明
集群外节点:
集群环境:
cdh05.fayson.com节点并未添加到CM中;
3.部署Gateway节点
1.将集群的hosts文件同步至该Gateway节点(cdh05.fayson.com)
代码语言:javascript复制[root@cdh01 ~]# scp /etc/hosts cdh05.fayson.com:/etc/
(可左右滑动)
2.登录集群任意节点,将集群的Java目录拷贝至(cdh05.fayson.com)节点的/usr/java目录下
代码语言:javascript复制[root@cdh01 conf]# scp -r /usr/java/jdk1.8.0_131/ cdh05.fayson.com:/usr/java/
(可左右滑动)
3.登录CDH集群的任意节点,将/opt/cloudera/parcels目录压缩并拷贝至(cdh05.fayson.com)节点
代码语言:javascript复制[root@cdh01 parcels]# tar -czvf cdh.tar.gz CDH-5.14.2-1.cdh5.14.2.p0.3/ CDH/
[root@cdh01 ~]# scp -r /opt/cloudera cdh05.fayson.com:/opt/
(可左右滑动)
4.登录(cdh05.fayson.com)节点的服务器上,创建/opt/cloudera/parcels目录,并将cdh.tar.gz解压至该目录下
代码语言:javascript复制[root@cdh05 ~]# mkdir -p /opt/cloudera/
[root@cdh05 ~]# tar -zxvf cdh.tar.gz -C /opt/cloudera/parcels
[root@cdh05 ~]# ll /opt/cloudera/parcels/
(可左右滑动)
5.在(cdh05.fayson.com)节点上执行如下命令创建服务配置文件存放目录
代码语言:javascript复制[root@cdh05 ~]# mkdir -p /etc/spark/conf
[root@cdh05 ~]# mkdir -p /etc/hadoop/conf
[root@cdh05 ~]# mkdir -p /et/hbase/conf
[root@cdh05 ~]# mkdir -p /etc/hive/conf
(可左右滑动)
登录CDH集群拥有spark、hadoop、hbase、hive等Gateway节点上将/etc/*/conf目录下的配置文件拷贝至(cdh05.fayson.com)节点相应目录下
代码语言:javascript复制scp -r /etc/hadoop/conf/* cdh05.fayson.com:/etc/hadoop/conf
scp -r /etc/spark/conf/* cdh05.fayson.com:/etc/spark/conf
scp -r /etc/hbase/conf/* cdh05.fayson.com:/etc/hbase/conf
scp -r /etc/hive/conf/* cdh05.fayson.com:/etc/hive/conf
(可左右滑动)
Spark配置文件:
HBase配置文件:
Hive配置文件:
Hadoop配置文件:
6.配置(cdh05.fayson.com)节点的环境变量
修改/etc/profile配置文件,在文件的末尾增加如下配置:
代码语言:javascript复制export JAVA_HOME=/usr/java/jdk1.8.0_131
export CDH_HOME=/opt/cloudera/parcels/CDH
export PATH=$CDH_HOME/bin:$PATH
(可左右滑动)
修改后执行如下命令是环境变量生效:
代码语言:javascript复制[root@cdh05 ~]# source /etc/profile
(可左右滑动)
4.GateWay客户端命令验证
1.执行hadoop命令测试
代码语言:javascript复制[root@cdh05 ~]# hadoop fs -ls /
(可左右滑动)
hadoop命令执行成功。
2.向集群提交一个MR作业
代码语言:javascript复制[root@cdh05 ~]# hadoop jar /opt/cloudera/parcels/CDH/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar pi 5 5
(可左右滑动)
作业执行成功。
3.使用yarn命令查看
代码语言:javascript复制[root@cdh05 ~]# yarn application --list
(可左右滑动)
Yarn命令执行成功。
4.使用hbase shell访问HBase
代码语言:javascript复制[root@cdh05 ~]# hbase shell
(可左右滑动)
5.使用hive和beeline访问Hive
代码语言:javascript复制[root@cdh05 ~]# hive
(可左右滑动)
Beeline访问:
代码语言:javascript复制[root@cdh05 ~]# beeline
beeline> !connect jdbc:hive2://cdh01.fayson.com:10000/;principal=hive/cdh01.fayson.com@FAYSON.COM
(可左右滑动)
6.使用Impala-shell访问Hive
代码语言:javascript复制[root@cdh05 ~]# impala-shell -i cdh03.fayson.com
(可左右滑动)
5.总结
1.配置Gateway节点时需要将各服务的客户端配置文件拷贝至Gateway节点的对应目录下,默认为/etc/{servicename}/conf目录,否则无法访问的CDH集群。
2.配置Gateway节点是需要将集群的/usr/java目录下的JDK拷贝至Gateway节点的对应目录下。
3.配置Gateway环境变量时使用的/opt/cloudera/parcels/CDH/bin目录下的服务命令,使用其他目录下的可能会报错。
提示:代码块部分可以左右滑动查看噢
为天地立心,为生民立命,为往圣继绝学,为万世开太平。 温馨提示:要看高清无码套图,请使用手机打开并单击图片放大查看。
推荐关注Hadoop实操,第一时间,分享更多Hadoop干货,欢迎转发和分享。
原创文章,欢迎转载,转载请注明:转载自微信公众号Hadoop实操