3,特点:面向列,支持独立索引,每个列支持存储多版本,稀疏性:空列不占内存,可随意做列扩展,传统DB无数据的列会以null填充。因为hbase是基于hdfs 的所以具有扩展性、高可用性、动态增加DataNode、高性能:LSM数据结构(子节点不断合...
项目大致过程是:flume监控日志文件,定时把文件清洗后上传到hdfs上,上传清晰后的数据是格式化的,可被hive识别,然后hive创建表,写脚本,执行hql语句,把执行结果写到hdfs上,最后为了方便查看,把放在hdfs上的结果通过sqoop放在mysql...