最新 最热

Spark有几种部署方式?

Spark部署模式分为Local模式(本地单机模式)和集群模式,在Local模式下,常用于本地开发程序与测试,而集群模式又分为Standalone模式(集群单机模式)、Yarn模式和Mesos模式,关于这三种集群模式的相关介绍具体如下:...

2022-05-11
1

图解图库JanusGraph系列-janusgraph图数据库的本地源码编译教程(janusgraph source code compile)

源码分析 的第一步就是要先编译好源代码,才能进行debug跟踪流程查看,本文总结了janusgraph源码编译的全流程!

2022-05-11
1

大数据教程-01HDFS的基本组成和原理

起源于2003年谷歌的Google File System相关论文,随后Doug Cutting(我们下面就叫他切哥吧)基于GFS的论文实现了分布式文件系统,并把它命名为NDFS(Nutch Distributied File System)。...

2022-05-10
1

在windows上编译Inlong所遇到的问题

在windows中,由于Inlong的很多单元测试用例都需要用到hadoop的相关组件进行测试。可以采用winunits配合测试,winutils是windows上专门配合hadoop和yarn测试的工具。 在github上下载该工具:...

2022-05-10
1

hadoop之HDFS与MapReduce

雏形开始于2002年的Apache的Nutch,Nutch是一个开源Java 实现的搜索引擎。它提供了我们运行自己的搜索引擎所需的全部工具。包括全文搜索和Web爬虫。

2022-05-10
1

NameNode和DataNode工作原理(图形化通俗易懂)

NameNode:存储文件的元数据。作用:管理HDFS的名称空间;配置副本策略;管理数据块(Block)映射信息;处理客户端读写请求。NameNode两个重要文件(内存中的镜像=fsimage+edits)。...

2022-05-10
0

HDFS读写数据流程(图形化通俗易懂)

DistributedFileSystem:代码位于hadoop-hdfs-projecthadoop-hdfs-clientsrcmainjavaorgapachehadoophdfsDistributedFileSystem.java(hadoop3.2.1)

2022-05-10
0

从容器化到资源池化,数栈云原生技术实践探索之路

近些年随着云计算和云原生应用的兴起,容器技术可以很好地解决许多问题,所以将大数据平台容器化是一种理想的方案。本文将结合袋鼠云数栈在Flink on Kubernetes的实践让您对大数据平台容器化的操作和价值有初步的了解。...

2022-05-10
1

大数据高可用技术之zookeeper3.4.5安装配置

下载地址:https://www.apache.org/dyn/closer.cgi/zookeeper/

2022-05-10
1

Win10安装Hadoop3.0.0(大数据入门必经之路)

2、将hadoop-3.0.0/bin文件复制一份,改名为hadoop-3.0.0/bin.template

2022-05-10
1