大数据学习之环境构建

2022-07-04 15:18:20 浏览数 (1)

【前置条件:需准备一台Linux or Mac OS 机器, 并且安装好了Docker 应用】

step1:本文是以docker image 构建为示例进行讲解。

https://www.cloudera.com/downloads/quickstart_vms/5-13.html 从此处下载需要学习的环境镜像文件,由于文件比较大,大家需要些耐心,下载操作如下图所示:

step2:下载完成后的文件格式是 tar.gz 文件类型,进入到下载好文件的目录, 首先解压: tar -xvf cloudera-quickstart-vm-5.13.0-0-beta-docker.tar 再导入到本地的镜像中: docker import cloudera-quickstart-vm-5.13.0-0-beta-docker.tar 查看镜像是否导入成功:

docker images

step3:此时可以去启动镜像,生成一个运行的容器,操作命令如下: docker run -d -it --name bigdata -p 80:80 -p 8088:8088 -p 8888:8888 6ce4decde2ce

step4:上述启动命令将镜像中的80,8088,8888 三个端口进行对外暴露,大家可以分别打开如下三个界面:


快速学习手册


hadoop 的任务监控页面


hive UI 的操作页面

step5:大家可以根据【快速操作手册】的学习资料进行相应的操作学习,当你操作到sqoop命令将mysql 数据导入到hadoop 中的hive 数据库时,hadoop 的任务监控页面可以看到正在运行的job.

使用cloudera/cloudera 登陆到 hive UI 的操作页面,可以将【快速操作手册】中的操作在这个页面上进行练习学习。至此分享完成

0 人点赞