最新 最热

Hive源码系列(四)hive2.1.1源码包介绍及调试

这次主要对hive源码包及hive的两种调试方式做了介绍,这篇结束后,整个源码调试环境的搭建已经完成。

2020-04-18
0

Hive源码系列(五)编译模块之整体介绍

Driver:提供执行接口,负责接收查询请求并建立session,创建一系列环境参数等

2020-04-18
1

Hive源码系列(六)编译模块之词法、语法解析 (上)

词法、语法解析模块会先介绍一下antlr环境(上)。然后举实际案例说明怎么使用antlr工具、利用antlr生成的Lexer、Parser、TreeParser代码,获取asttree。这些都是hive获取asttree的过程,理解了这些,再理解hive的asttree就很...

2020-04-18
0

Hive源码系列(七)编译模块之词法、语法解析 (中)

这篇主要举实际案例说明怎么使用antlr工具、利用antlr生成的Lexer、Parser、TreeParser代码,获取asttree。这些都是hive获取asttree的过程,理解了这些,再理解hive的asttree就很容易了...

2020-04-18
0

Hive源码系列(七)编译模块之词法、语法解析 (下)

对一个已有的项目进行语法分析,首先是要找到语法分析文件,分析语法文件之间的关系,然后根据语法分析文件提供的接口,确定语法解析在这个体系中所处的位置。...

2020-04-18
0

Flink_sql_client1.10源码在IDEA中集成hive并运行

最近一直在跟进flink_sql,为以后做更深入的了解做准备,这篇主要记录一下运行sql_client源码的过程~~

2020-04-18
1

sparksql比hivesql优化的点(窗口函数)

有时候,一个 select 语句中包含多个窗口函数,它们的窗口定义(OVER 子句)可能相同、也可能不同。

2020-04-18
0

Hive sql窗口函数源码分析

在了解了窗口函数实现原理 spark、hive中窗口函数实现原理复盘 和 sparksql比hivesql优化的点(窗口函数)之后,今天又撸了一遍hive sql 中窗口函数的源码实现,写个笔记记录一下。...

2020-04-18
0

Hive中group by还能这样玩?

表中一共有四列数据,分别是地区,员工姓名,月份和销量。目前的需求时,想同时得到各地区的销量、各员工的销量,以及每个员工在每个地区的销量。...

2020-04-14
0

大数据查询引擎Presto

Presto设计精巧,可以处理海量数据,最大化地利用硬件性能,计算全部在内存中完成,很好的利用高速网络来进行数据调度。性能基本上是Hive的10倍。

2020-04-11
0