手把手教你轻松构建大数据学习环境!

2022-07-05 14:45:07 浏览数 (1)

前置条件:需准备一台Linux or Mac OS 机器, 并且安装好了Docker 应用

Step1:本文是以docker image 构建为示例进行讲解

https://www.cloudera.com/downloads/quickstart_vms/5-13.html 从此处下载需要学习的环境镜像文件,由于文件比较大,大家需要些耐心,下载操作如下图所示:

Step2:下载完成后的文件格式是 tar.gz 文件类型,进入到下载好文件的目录 首先解压:

代码语言:javascript复制
tar -xvf cloudera-quickstart-vm-5.13.0-0-beta-docker.tar

再导入到本地的镜像中:

代码语言:javascript复制
docker import cloudera-quickstart-vm-5.13.0-0-beta-docker.tar

查看镜像是否导入成功:

代码语言:javascript复制
docker images

Step3:此时可以去启动镜像,生成一个运行的容器

操作命令如下:

代码语言:javascript复制
docker run -d -it --name bigdata -p 80:80 -p 8088:8088 -p 8888:8888 6ce4decde2ce

Step4:上述启动命令将镜像中的80,8088,8888 三个端口进行对外暴露

大家可以分别打开如下三个界面:


快速学习手册


hadoop 的任务监控页面


hive UI 的操作页面

Step5:大家可以根据【快速操作手册】的学习资料进行相应的操作学习

当你操作到sqoop命令将mysql 数据导入到hadoop 中的hive 数据库时,hadoop 的任务监控页面可以看到正在运行的job.

使用cloudera/cloudera 登陆到 hive UI 的操作页面,可以将【快速操作手册】中的操作在这个页面上进行练习学习。

0 人点赞