1、 存储海量数据:
HDFS可横向扩展,其存储的文件可以支持PB级数据
2、容错性高:
数据保存多个副本,副本丢失后自动恢复。 可构建在廉价(与小型机大型机对比)的机器上,实现线性扩展。(随着节点数量的增加,集群的性能-计算性能和 存储性能都会有所增加)
当集群增加新节点之后,namenode也可以感知,进行负载均衡,将数据分发和备份数据均衡到新的节点上。(负 载均衡:集群可将原本使用容量较高的节点上的数据自动写入新的节点上,达到所有节点容量均匀)每个节点磁盘使 用容量百分比的差异可以人工设置。
3、大文件存储:
数据分块存储,将一个大块的数据切分成多个小块的数据。