最新 最热

Hadoop完全分布式集群搭建

准备了四个服务器,IP为192.168.0.236、192.168.0.237、192.168.0.238、192.168.0.239,其中192.168.0.236作为主节点,其他3个作为从节点。具体版本信息如下:

2022-04-22
0

大数据繁荣生态圈组件之实时大数据Druid小传(一)

项目中采用的关系型数据库是mysql,那么关系型数据库有哪些优劣势,我们可以参考下面的分析: 关系型数据库的优点: 1.基于ACID,支持事务,适合于对安全性和一致性要求高的的数据访问 2.可以进行Join等复杂查询,处理复杂业务逻辑...

2022-04-21
1

Hadoop启动异常的处理--DataNode未启动

hadoop格式化后,我们需要启动hdfs。然而,有些时候启动hdfs并不是那么顺利,往往会出现DataNode未启动的现象。

2022-04-21
0

三面字节总结:Spark+hadoop+数据仓+Flink+kafka 资料一应俱全!

从时间节点上来看,每年的 3月、4月是一年中求职跳槽的黄金季! 最近也收到很多小伙伴的后台留言 “有没有大数据学习资源,进阶学习路线,PDF,电子书,面试文档等等...” 一系列问题,这篇文章等于是针对以上的问题统一做回答了。...

2022-04-19
1

Hadoop Shell命令

调用文件系统(FS)Shell命令应使用 bin/hadoop fs <args>的形式。 所有的的FS shell命令使用URI路径作为参数。URI格式是scheme://authority/path。对HDFS文件系统,scheme是hdfs,对本地文件系统,scheme是file。其中scheme...

2022-04-19
0

Apache Kylin原理与架构

Apache Kylin是一个开源的大数据分布式分析引擎,提供Hadoop之上的SQL查询接口及多维分析(OLAP)能力(可以把Kylin定义为OLAP on Hadoop)。Apache Kylin于2015年11月正式毕业成为Apache基金会(ASF) 顶级项目,是第一个由中国团...

2022-04-18
1

Spark专题系列(一):Spark 概述

Spark适用于各种各样原本需要多种不同的分布式平台的场景,包括批处理,迭代计算,交互式查询,流处理,通过在一个统一的框架下支持这些不同的计算,Spark使我们可以简单而低耗地把各种处理流程整合在一起。...

2022-04-18
1

Hadoop分布式部署

对于Hadoop Master(ResourceManager/NameNode)节点硬件配置要高一些

2022-04-18
1

HDFS设计之namenode和datanode

HDFS 集群节点以master/slave(管理者-工作者模式)运行,namenode就是一个master , 而datanode就是slave 。

2022-04-18
0

Spark 集群环境部署

本篇主要记录一下Spark 集群环境搭建过程以及在搭建过程中所遇到的问题及解决方案

2022-04-18
1