摘要:本文介绍Hadoop操作前的准备工作。
关键词:Hadoop Linux JDK WinSCP
俗语说,“磨刀不误砍柴工”。Hadoop操作前的准备工作可以加快Hadoop的操作与应用。
Hadoop操作前准备工作,概括如下。
第一 GNU/Linux环境构建。
关于Linux环境构建,可以直接在计算机上安装Linux,或者基于Windows下的虚拟化安装Linux,常用的虚拟化软件有VMware或者VirtualBox。
如何在VMware下安装Linux,请阅读文章:RedHat CentOS 在VMware下的安装。
如何在VirtualBox下安装Linux,请阅读文章:RedHat CentOs 在VirtualBox下的安装。
第二 准备相关软件
1 Linux 环境下的JDK软件,建议选择Sun公司发行的JDK6.0版本。
2 Hadoop软件包,目前Hadoop有这些版本型号。
- 1.2.X - current stable version, 1.2 release
- 2.2.X - current stable 2.x version
- 2.3.X - current 2.x version
- 0.23.X - similar to 2.X.X but missing NN HA.
作者现在使用Hadoop 1.2.1 软件包,它的具体下载地址如下:
http://apache.fayea.com/apache-mirror/hadoop/common/hadoop-1.2.1/
3 小工具WinSCP, What is WinSCP? WinSCP is a useful open source FTP client for transferring files between local and remote computer safely,因而可以安全方便地实现Windows环境和Linux环境之间的数据相互传送。下载地址:
http://winscp.joydownload.com/?c=4&gclid=CNXM3I_z67wCFS2t4godkhUAvQ
Source:
1 http://hadoop.apache.org/docs/r1.2.1/single_node_setup.html
2 http://hadoop.apache.org/docs/r1.0.4/cn/quickstart.html