最新 最热

CentOS7.5搭建Flink1.6.1分布式集群详解

安装包下载地址:http://flink.apache.org/downloads.html  ,选择对应Hadoop的Flink版本下载

2022-07-26
1

Flink入门基础 – 简介

这几年大数据的飞速发展,出现了很多热门的开源社区,其中著名的有 Hadoop、Storm,以及后来的 Spark,他们都有着各自专注的应用场景。Spark 掀开了内存计算的先河,也以内存为赌注,赢得了内存计算的飞速发展。Spark 的火热...

2022-07-26
1

Hadoop2.5.0伪分布式环境搭建

本章主要介绍下在Linux系统下的Hadoop2.5.0伪分布式环境搭建步骤。首先要搭建Hadoop伪分布式环境,需要完成一些前置依赖工作,包括创建用户、安装JDK、关闭防火墙等。...

2022-07-26
0

Hadoop集群配置免密登录方法

Hadoop集群包含1个主节点和3个从节点,需要实现各节点之间的免密码登录,下面介绍具体的实现方法。

2022-07-25
0

Hadoop2.0完全分布式集群搭建方法(CentOS7+Hadoop2.7.7)

本文详细介绍搭建4个节点的完全分布式Hadoop集群的方法,Linux系统版本是CentOS 7,Hadoop版本是2.7.7,JDK版本是1.8。

2022-07-25
0

大数据开发步骤和流程「建议收藏」

第二步是通过数据分析技术对数据进行探索性研究,包括无关数据的剔除,即数据清洗,与寻找数据的模式探索数据的价值所在;

2022-07-25
0

CentOS 7 下搭建Hadoop 2.9 分布式集群

首先说明,本文记录的是搭建的3节点的完全分布式Hadoop集群的过程,环境是CentOS 7,1个nameNode,2个dataNode,如下:

2022-07-24
0

在 Linux Ubuntu 18.04/18.10上安装Hadoop图文详解

Apache Hadoop是一个开源框架,用于分布式存储以及在商用硬件上运行的计算机集群上的大数据的分布式处理。 Hadoop将数据存储在Hadoop分布式文件系统(HDFS)中,并使用MapReduce完成这些数据的处理。 YARN提供用于在Hadoop集...

2022-07-24
0

Zeppelin0.7.2结合hive解释器进行报表展示

前提:服务器已经安装好了Hadoop_client端即hadoop的环境hbase,hive等相关组件

2022-07-24
1

CentOS 6.5中部署Zeppelin并配置账号密码验证

1.安装JavaZeppelin支持的操作系统如下图所示。在安装Zeppelin之前,你需要在部署的服务器上安装Oracle JDK 1.7或以上版本, 并配置好相应的JAVA_HOME环境变量。以CentOS为例,具体操作过程如下:...

2022-07-24
0