最新 最热

hive学习笔记之十:用户自定义聚合函数(UDAF)

执行结果如下,可见guangdong的guangzhou和shenzhen总长度为17,jiangsu的nanjing为7,shanxi的xian和hanzhong总长度12,符合预期:

2022-05-06
1

hive学习笔记之九:基础UDF

欢迎访问我的GitHub 这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos 《hive学习笔记》系列导航基本数据类型复杂数据类型内部表和外部表分区表分桶HiveQL基础内置函数Sqoop基础UDF...

2022-05-06
1

hive学习笔记之八:Sqoop

Sqoop是Apache开源项目,用于在Hadoop和关系型数据库之间高效传输大量数据,本文将与您一起实践以下内容:

2022-05-06
1

hive学习笔记之七:内置函数

欢迎访问我的GitHub 这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos 《hive学习笔记》系列导航基本数据类型复杂数据类型内部表和外部表分区表分桶HiveQL基础内置函数Sqoop基础UDF...

2022-05-06
1

hive学习笔记之六:HiveQL基础

结果如下,可见不会根据student表的addressid字段值去address查找记录,而是将addrerss的记录全部连接一次:

2022-05-06
1

hive学习笔记之五:分桶

欢迎访问我的GitHub 这里分类和汇总了欣宸的全部原创(含配套源码):https://github.com/zq2599/blog_demos 《hive学习笔记》系列导航基本数据类型复杂数据类型内部表和外部表分区表分桶HiveQL基础内置函数Sqoop基础UDF...

2022-05-06
1

hive学习笔记之四:分区表

本文是《hive学习笔记》系列的第四篇,要学习的是hive的分区表,简单来说hive的分区就是创建层级目录的一种方式,处于同一分区的记录其实就是数据在同一个子目录下,分区一共有两种:静态和动态,接下来逐一尝试;...

2022-05-06
1

hive学习笔记之三:内部表和外部表

至此,咱们对内部表和外部表已经有了基本了解,接下来的文章学习另一种常见的表类:分区表

2022-05-06
1

hive学习笔记之二:复杂数据类型

执行结果如下,第一条记录friends数组中有tom_friend_0,显示为true,第二条记录不包含,就显示false:

2022-05-06
1

hive学习笔记之一:基本数据类型

至此,hive的基本数据类型已经了解,接下来的章节咱们一起学习了解复杂数据类型;

2022-05-06
1