许多人想转行大数据,学习大数据技术,可以看哪些书来增加理解呢?
01
《Hadoop权威指南》
作者: (美) Tom White
本书内容丰富,展示了如何使用Hadoop构建可靠、可伸缩的分布式系统,程序员可从中探索如何分析海量数据集,管理员可以了解如何建立与运行Hadoop集群。
02
《Hive编程指南》
作者:Edward Capriolo、Dean Wampler等
一本ApacheHive的编程指南,旨在介绍如何使用Hive的SQL方法,通过大量的实例,首先介绍如何在用户环境下安装和配置Hive,并对Hadoop和MapReduce进行详尽阐述,演示Hive如何在Hadoop生态系统进行工作。
03
《Hbase权威指南》
作者: (美)Lars George
如何通过使用与HBase高度集成的Hadoop将HBase的可伸缩性变得简单;把大型数据集分布到相对廉价的商业服务器集群中;了解HBase架构的细节,包括存储格式、预写日志、后台进程等;在HBase中集成MapReduce框架;了解如何调节集群、设计模式、拷贝表、导入批量数据和删除节点等。
04
《Hadoop虚拟化》
作者:(美)George Trujillo
旨在帮助读者了解和掌握不同虚拟化Hadoop选择的优缺点、虚拟化Hadoop的配置及其注意事项。
05
《Flink入门与实战》
这是一本Flink入门级图书,力求详细而完整地描述Flink基础理论与实际操作,旨在帮助读者从零开始快速掌握Flink的基本原理与核心功能。
06
《Kafka入门与实践》
作者:牟大恩
基于Kafka 0.10.1.1版本,深入剖析Kafka源码与框架。书中的大量实例来源于作者在实际工作中的实践,具有现实指导意义。