【前置条件:需准备一台Linux or Mac OS 机器, 并且安装好了Docker 应用】
step1:本文是以docker image 构建为示例进行讲解。
https://www.cloudera.com/downloads/quickstart_vms/5-13.html 从此处下载需要学习的环境镜像文件,由于文件比较大,大家需要些耐心,下载操作如下图所示:
step2:下载完成后的文件格式是 tar.gz 文件类型,进入到下载好文件的目录, 首先解压: tar -xvf cloudera-quickstart-vm-5.13.0-0-beta-docker.tar 再导入到本地的镜像中: docker import cloudera-quickstart-vm-5.13.0-0-beta-docker.tar 查看镜像是否导入成功:
docker images
step3:此时可以去启动镜像,生成一个运行的容器,操作命令如下: docker run -d -it --name bigdata -p 80:80 -p 8088:8088 -p 8888:8888 6ce4decde2ce
step4:上述启动命令将镜像中的80,8088,8888 三个端口进行对外暴露,大家可以分别打开如下三个界面:
快速学习手册
hadoop 的任务监控页面
hive UI 的操作页面
step5:大家可以根据【快速操作手册】的学习资料进行相应的操作学习,当你操作到sqoop命令将mysql 数据导入到hadoop 中的hive 数据库时,hadoop 的任务监控页面可以看到正在运行的job.
使用cloudera/cloudera 登陆到 hive UI 的操作页面,可以将【快速操作手册】中的操作在这个页面上进行练习学习。至此分享完成