第一步 InputFormat Inputformat到hdfs上读取数据 将数据传给Split 第二步 Split Split将数据进行逻辑切分 将数据传给RR 第三步 RR(RecordReader) RR:将传入的数据转换成一行一行的数据,输入行首字母偏移量和对应数据 将...
impala是 cloudera提供的一款高效率的sql查询工具,提供实时的查询效果,官方测试性能比hive快10到100倍,其sql查询比sparkSQL还要更加快速,号称是当前大数据领域最快的查询sql工具。...