最新 最热

hbase 面试问题汇总

(2)、无模式:每行都有一个可排序的主键和任意多的列,列可以根据需要动态增加,同一个表中的不同行的可以有截然不同的列。

2020-06-19
0

HBase运维 | HBase宕机恢复案例一则

从上图可以看到zk中/Hbase/replication/rs的节点信息无法获取,然后我们立马去检查zk日志发现zk已经全部断联而且已经瘫痪,截图如下:

2020-06-18
0

0783-6.2.0-如何在Hue中集成HBase

Fayson在前面介绍了《0635-5.16.1-Hue集成HBase出现Api Error异常分析》和《0647-6.1.1-Hue集成HBase出现Api Error异常分析(续)》文章中说明了C5和C6中Hue与HBase集成的异常分析。本篇文章Fayson主要如何在C6.2.0的...

2020-06-17
0

细谈Hadoop生态圈

Hadoop在过去的几年里已经变得很成熟了。下面的图1-2显示了Hadoop生态系统堆栈。Apache Phoenix是HBase的SQL包装,它需要基本的HBase理解,在某种程度上,还需要理解它原生的调用行为。了解其他Hadoop生态系统组件以及HBas...

2020-06-15
1

面试必考点:HBase Compaction机制

Compaction是buffer->flush->merge的Log-Structured Merge-Tree模型的关键操作,主要起到如下几个作用:

2020-06-15
0

面试头条:HBASE 存储设计

5、Hbase的表在物理存储上,是按照列族来分割的,不同列族的数据一定存储在不同的文件中

2020-06-12
0

HBase 内部探索之旅

写缓存,K-V在MemStore中进行排序,达到阈值之后才会flush到StoreFile,每次flush生成一个新的StoreFile。

2020-06-12
0

Druid架构设计思想详解

对于目前大多数Druid 的使用场景来说,Druid 本质上是一个分布式的时序数据库,而对于一个数据库的性能来说,其数据的组织方式至关重要。为了更好地阐述Druid 的架构设计思想,我们得先从数据库的文件组织方式聊起。...

2020-06-11
0

大数据挖掘算法——时间衰变算法

遗忘曲线是由德国心理学家艾宾浩斯(Hermann Ebbinghaus )研究发现的,其描述了人类大脑对新事物遗忘的规律,人们可以从遗忘曲线中掌握遗忘规律并加以利用,从而提升自我记忆的能力。...

2020-06-11
0

源,数据,Hadoop——我们为什么需要Flume

将系统之间彼此隔离的消息系统已经存在了很长时间,在Hadoop 环境中Flume 做了这样的工作。Flume 是专门设计用来从大量的源,推送数据到Hadoop 生态系统中各种各样存储系统中去的,例如HDFS 和HBase。...

2020-06-11
0