概览
Apache HBase™是Hadoop数据库,一个分布式、可扩展的大数据存储。
当您需要对大数据进行随机、实时的读写访问时,请使用Apache HBase™。这个项目的目标是在商用硬件集群上托管非常大的表——数十亿行X数百万列。Apache HBase是一个开源的、分布式的、版本化的、非关系型的数据库,它模仿了Chang等人的谷歌的Bigtable: A distributed Storage System for Structured Data。正如Bigtable利用了谷歌文件系统提供的分布式数据存储,Apache HBase在Hadoop和HDFS上提供了类似Bigtable的功能。
基本特性
- 线性和模块化的可伸缩性。
- 严格一致的读写。
- 自动和可配置的分片表
- RegionServers之间的自动故障切换支持。
- 方便的基类支持Hadoop MapReduce作业与Apache HBase表。
- 易于使用Java API进行客户端访问。
- 实时查询的块缓存和Bloom过滤器。
- 通过服务器端筛选器下推查询谓词
- Thrift网关和支持XML、Protobuf和二进制数据编码选项的REST-ful Web服务
- 可扩展的基于JIRB的shell
- 支持通过Hadoop指标子系统将指标导出到文件或Ganglia;或通过JMX
本文为从大数据到人工智能博主「xiaozhch5」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://cloud.tencent.com/developer/article/1936583