最新 最热

大数据学习之Hbase面试题

首先通过meta表找到要读数据的region所在的RegionServer,然后去BlockCash中读取,如果没有就去Memstore中读取,如果也没有,那就去Hfile中去读 (1) 客户端访问Zookeeper,获取存放目标数据的Region信息,从而找到对应的Reg...

2022-09-03
1

大数据spark、hadoop、hive、hbase面试题及解析[通俗易懂]

(1)spark运行流程、源码架构 https://blog.csdn.net/sghuu/article/details/103547937

2022-09-02
2

0891-CDP Private Cloud Base 7.1.8正式GA

八月再见,九月你好,今天是九月一日,新学年开始,Cloudera正式发布CDP Base 7.1.8和Cloudera Manager 7.7.1。这个版本引入了诸多新功能,比如通过EC提升Ozone的存储效率,Cloudera Manager的HA,多NameNode支持,全面支持Impala4.0...

2022-09-02
2

大数据面试题(六)—-HBASE 面试题

版权声明:本文为CSDN博主「北京小辉」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。 原文链接:https://blog.csdn.net/silentwolfyh/article/details/103864901 ——————————————...

2022-09-02
2

RegionServer 发生full GC次数

问题描述及原因:HBase RegionServer 发生full gc,内存不足导致

2022-09-01
3

RegionServer RPC队列请求数较大

在EMR控制台进入“集群监控”,点击“DashBoard”,点击 “集群服务” --> HBASE --> 角色管理 -->RegionServer

2022-09-01
2

大数据——数据流式处理「建议收藏」

目前主流的流处理组件包括:Strom、Spark Streaming、KafKa、Flume、Flink、S3等,接下来将对上述组件做简要介绍。

2022-08-31
1

HBase RegionServer 请求排队延时较大

在EMR控制台进入“集群监控”,点击“DashBoard”,点击 Overview-DashBoard --> HBase-DashBoard --> IPC

2022-08-31
3

HBase RegionServer 请求处理延时较大

在regionserver日志搜索关键字 "TooLarge",若存在则需要业务侧优化表结构,优化大KV

2022-08-31
1

Hadoop生态系统-一般详细

首先我们先了解一下Hadoop的起源。然后介绍一些关于Hadoop生态系统中的具体工具的使用方法。如:HDFS、MapReduce、Yarn、Zookeeper、Hive、HBase、Oozie、Mahout、Pig、Flume、Sqoop。...

2022-08-31
2