最新 最热

Hadoop配置文件详解

这是一个描述集群中NameNode结点的URI-统一资源标识符(包括协议,主机名称,端口号),集群里面的每一台机器都需要知道NameNode的地址。DataNode结点会先在NameNode上注册,这样它们的数据才可以被利用。独立的客户端程序通过这...

2022-07-03
1

Hadoop-2.6.0环境搭建精简极致指导

从官网http://apache.fayea.com/hadoop/common/  下载hadoop

2022-07-03
1

入门Hadoop的WordCount程序

本篇文章主要说两部分:简单介绍MapReduce的工作原理;详细解释WordCount程序。

2022-07-03
1

Hadoop中HDFS的存储机制

HDFS(Hadoop Distributed File System)是Hadoop分布式计算中的数据存储系统,是基于流数据模式访问和处理超大文件的需求而开发的。下面我们首先介绍HDFS中的一些基础概念,然后介绍HDFS中读写操作的过程,最后分析了HDFS的优...

2022-07-03
1

HDFS中的命令行

hadoop fs –copyFromLocal /usr/localFile.txt sample.txt

2022-07-03
1

Hadoop简单API的Web应用开发

最近写了个Web程序来调用Hadoop的api,对Hadoop自带的管理方式进行了二次开发,加强了可操作性。现在简单的介绍下功能和方法。Hadoop版本为1.xx

2022-07-03
1

Ubuntu下利用MyEclipse开发Hadoop程序

开发的大环境是Ubuntu 11.04,Hadoop 0.20.2,MyEclipse 9.1

2022-07-03
1

Hadoop2.4 支持snappy

我们Hadoop 2.4集群默认不支持snappy压缩,但是最近有业务方说他们的部分数据是snappy压缩的(这部分数据由另外一个集群提供给他们时就是snappy压缩格式的)想迁移到到我们集群上面来进行计算,但是直接运行时报错:...

2022-07-03
0

Hadoop的DataNode无法启动问题解决

java.io.IOException: File  … could only be replicated to 0 nodes, instead of 1。 使用dfsadmin -report报无数据节点,如下:[Hadoop@namenode hadoop]$ hadoop dfsadmin -report...

2022-07-03
1

Hadoop开启WebHDFS服务及测试

WebHDFS观念是基于HTTP操作,比如GET、PUT、POST和DELETE。像OPEN、GETFILESTATUS、LISTSTATUS的操作是使用HTTP GET,其它的像CREAT、MKDIRS、RENAME、SETPERMISSION是依赖于HTTP PUT类型。 APPEND操作时基于HTTP POST类...

2022-07-03
1