Impala是什么?
Impala提供对大数据更快速,交互式 SQL查询。
Impala支持对存储在HDFS、HBase及S3等数据查询。
Impala使用和Hive相同的元数据、SQL定义、ODBC驱动及用户接口。
Impala提供实时、批数据的统一查询平台。
Impala是对现有大数据查询工具的补充,不能替代基于Hive的MapReduce批处理任务框架(适用于耗时长的批处理任务,例如ETL等)。
Impala建立在集群之上的分布式查询,易于扩展。
数据查询过程:
数据文件读写。
接受来自 impala-shell、Hue、JDBC、ODBC的查询语句。
集群并行执行查询。
返回结果。