最新 最热

Cloudera Manager 安装集群遇到的问题及解决

多次安装集群,但每次都不能顺利,都会遇到很多很多的坑,今天就过去踩过的坑简单的总结一下,希望已经踩了的和正在踩的童鞋能够借鉴一下,希望对你们能有所帮助。...

2022-07-24
1

大数据开发的工具有哪些?

作为一个大数据开发人员,每天要与使用大量的大数据工具来完成日常的工作,那么目前主流的大数据开发工具有哪些呢?

2022-07-23
1

jps详解

首先jps的目录在java中,如下图所示。jps主要用于查看java进程,在查看hdfs的启动进程时可以代替ps -ef | grep hdfs命令。

2022-07-23
1

Kafka到Hdfs的数据Pipeline整理

GitHub地址: https://github.com/apache/flume

2022-07-21
0

使用Apache Flink和Kafka进行大数据流处理

Flink是一个开源流处理框架,注意它是一个处理计算框架,类似Spark框架,Flink在数据摄取方面非常准确,在保持状态的同时能轻松地从故障中恢复。

2022-07-20
1

Hadoop大数据部署

关闭防火墙:systemctl stop firewalldsystemctl disable firewalld

2022-07-20
1

编写WordCount程序之一固定格式讲解

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/107708.html原文链接:https://javaforall.cn

2022-07-20
1

Windows下搭建Spark+Hadoop开发环境

1. 下载Hadoop2.7.1版本(写Spark和Hadoop主要是用到了Yarn,因此Hadoop必须安装)

2022-07-20
1

sparkr基本操作1

libpath <- c(libpath, “/home/r/spark/spark-1.4.0-bin-hadoop2.4/R/lib”)

2022-07-20
1

初识HDFS原理及框架

HDFS(Hadoop Distributed File System)是Hadoop项目的核心子项目,首先它是一个文件系统,用于存储文件,通过目录树来定位文件位置;其次,它是分布式的,由很多服务器联合起来实现其功能,集群中的服务器有各自的角色。...

2022-07-19
0