概述
Spark SQL作为大数据开发中非常重要的工具,如果能对其内部原理有进一步的了解,那么能更好的使用它。
计划花半年时间,把Spark SQL源码看一遍,算完整的总结一下。
内容大纲
ParseTree
UnResolved Logical Plan
Resolved Logical Plan
Analyzed Logical Plan
Optimized Logical Plan
Physical Plan
Executed Plan
版本信息
Spark SQL版本:3.3
Scala版本:2.12
注意:本系列文章参考《Spark SQL内核剖析》