hbase拾遗「建议收藏」

2022-08-09 16:04:40 浏览数 (1)

大家好,又见面了,我是你们的朋友全栈君。

1,hbase 全称:hadoop dataBase ,即hadoop数据库

2,使用场景:大数据量,准实时查询

3,特点:面向列,支持独立索引,每个列支持存储多版本,稀疏性:空列不占内存,可随意做列扩展,传统DB无数据的列会以null填充。因为hbase是基于hdfs 的所以具有扩展性、高可用性、动态增加DataNode、高性能:LSM数据结构(子节点不断合并成主节点),分区(region)存储数据。

4,Hbase内两个主要进程服务:

Master 和regionServer。master做管理,监控调度各regionServer。

一个regionServer管理多个region区,每个regionServer服务定时像master报告健康状态和存储内容。

regionServer可通过向master报告健康状态达到高可用性,即一个regionServer服务挂掉后,可由其他regionserver来管理挂掉服务下的region

5,zookeeper可接受到同master来自regionServer报告的信息

6,对比关系性数据库|:列动态增加,数据自动切分,高并发读写

缺点:不支持条件查询

7,删除表:要先禁用disable禁用表,在drop删除表。

8,列在列簇中有序,列数没有限制,一张表列簇不会超过5个,列只有插入数据后才存在。

图示说明hbase存储结构:

Hbase智能分区

RowKey

TimeStamp

Column Family1(列簇)

Column Family2(列簇)

Column Family3(列簇)

Region-1

11111

t6

C1:name

小三

t5

c1:age

25

t4

c1:tel

1.23457E 11

Region-2

21111

t3

c1:name

小四

t2

c1:age

30

c2:collage

北京大学

c3:job1

CEO

t1

c1:tel

5647876213

对应说明,联想简历样式

个人信息列簇

教育经历列簇

工作经历列簇

姓名

年龄。。等

大学

研究生等

工作1

工作2

发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/105976.html原文链接:https://javaforall.cn

0 人点赞