最新 最热

Hadoop3.x搭建详细教程 | 历史服务器的配置与日志聚合

Hadoop由Apache基金会开源,是一个分布式的储存与计算平台。目前Hadoop已经更新到了3.x以上的版本,相比于Hadoop2.x,Hadoop3增加了更多便于开发的新特性。

2022-05-19
1

大数据不得不说的事儿:存算分离凭什么能一统天下

一个是成本问题,随着累积的数据量的增大,大数据业务量的增多,数据存储和处理的成本越来越高,企业数据基础设施的投资越来越大,这部分投资挤占了企业大数据业务创新的空间。...

2022-05-19
1

如何用SQL实现用户行为漏斗分析

1 每日活跃设备明细 dwd_start_log--->dws_uv_detail_day

2022-05-19
1

【万字长文】HDFS最全知识点整理(建议收藏)

1)跟NN通信查询元数据(block所在的DN的节点),找到文件块所在的DN的服务器。2)挑选一台DN(就近原则,然后随机)服务器,请求建立socket流。3)DN开始发送数据(从磁盘里读取数据放入流,一packet为单位做校验) 4)客户端以packet为单位接...

2022-05-17
1

【Hadoop】如何做到Hadoop集群删库不跑路……

扯个犊子先,我司进行集群迁移,没有用的测试机器要进行格式化卖掉了,然后突然一条伟大的命令,误删除了正在使用的hadoop集群所有节点的操作系统盘,数据盘保留,灾难就此来了。...

2022-05-17
1

Hbase 数据迁移闭坑指南

HBase自身也提供了ExportSnapshot的方法可以从HDFS文件层基于某个快照快速的导出HBase的数据,并不会对RegionServer造成影响,但该源生的方法不支持增量。

2022-05-17
1

大数据小白到入门的知识结构

博主96年,从事大数据开发工作4年。实时、离线、数仓、springcloud、爬虫、机器学习都略有接触及实际开发经验。

2022-05-17
1

Hadoop单机模式安装

Java是Hadoop的主要先决条件。首先,应该使用命令“java-version”验证 java 存在在系统中。Java version 命令的语法如下。

2022-05-16
1

hadoop环境遇到的问题 二

接着一,继续记录hadoop环境遇到的一些问题。1. 报错信息:Hadoop-Error: Could not find or load main class org.apache.hadoop.mapreduce.v2.app.MRAppMaster

2022-05-16
1

vivo 万台规模 HDFS 集群升级 HDFS 3.x 实践

Hadoop 3.x的第一个稳定版本在2017年底就已经发布了,有很多重大的改进。

2022-05-16
2