大家好,又见面了,我是你们的朋友全栈君。
1,hbase 全称:hadoop dataBase ,即hadoop数据库
2,使用场景:大数据量,准实时查询
3,特点:面向列,支持独立索引,每个列支持存储多版本,稀疏性:空列不占内存,可随意做列扩展,传统DB无数据的列会以null填充。因为hbase是基于hdfs 的所以具有扩展性、高可用性、动态增加DataNode、高性能:LSM数据结构(子节点不断合并成主节点),分区(region)存储数据。
4,Hbase内两个主要进程服务:
Master 和regionServer。master做管理,监控调度各regionServer。
一个regionServer管理多个region区,每个regionServer服务定时像master报告健康状态和存储内容。
regionServer可通过向master报告健康状态达到高可用性,即一个regionServer服务挂掉后,可由其他regionserver来管理挂掉服务下的region
5,zookeeper可接受到同master来自regionServer报告的信息
6,对比关系性数据库|:列动态增加,数据自动切分,高并发读写
缺点:不支持条件查询
7,删除表:要先禁用disable禁用表,在drop删除表。
8,列在列簇中有序,列数没有限制,一张表列簇不会超过5个,列只有插入数据后才存在。
图示说明hbase存储结构:
Hbase智能分区 | RowKey | TimeStamp | Column Family1(列簇) | Column Family2(列簇) | Column Family3(列簇) | |||
---|---|---|---|---|---|---|---|---|
列 | 值 | 列 | 值 | 列 | 值 | |||
Region-1 | 11111 | t6 | C1:name | 小三 | ||||
t5 | c1:age | 25 | ||||||
t4 | c1:tel | 1.23457E 11 | ||||||
… | … | … | … | … | … | … | … | |
Region-2 | 21111 | t3 | c1:name | 小四 | ||||
t2 | c1:age | 30 | c2:collage | 北京大学 | c3:job1 | CEO | ||
t1 | c1:tel | 5647876213 | ||||||
… | … | … | … | … | … | … | … | |
对应说明,联想简历样式 | ||||||||
个人信息列簇 | 教育经历列簇 | 工作经历列簇 | ||||||
姓名 | 年龄。。等 | 大学 | 研究生等 | 工作1 | 工作2 |
发布者:全栈程序员栈长,转载请注明出处:https://javaforall.cn/105976.html原文链接:https://javaforall.cn