面试篇: SparkSql如何把Sql转化成RDD可以执行的任务

2022-06-01 08:44:31 浏览数 (1)

一、SparkSQL底层执行流程图

二、具体流程

1.SparkSql通过Parser(解析器)把Sql转化成UnResolved Logical Plan(这是一棵Parsed Logical Plan AST语法树)。

2.SparkSql通过Analyzer(分析器)借助Catalog中的元数据(Schema) 把UnResolved Logical Plan转化成Resolved Logical Plan(这是一棵Analyzer Logical Plan AST语法树)。

3.SparkSql通过Optimizer(优化器)将执行计划转化为Optimized Logical Plan。

4.SparkSql通过SparkPlan将执行计划转化为Physical Plan。

总结:SparkSql -> Parsed Logical Plan AST语法树 -> Analyzer Logical Plan AST语法树 -> Optimized Logical Plan -> Physical Plan。

0 人点赞