最新 最热

2021年大数据Hive(一):​​​​​​​Hive基本概念

Hive是一个构建在Hadoop上的数据仓库框架。最初,Hive是由Facebook开发,后来移交由Apache软件基金会开发,并作为一个Apache开源项目。

2021-10-11
1

2021年大数据Hive(二):Hive的三种安装模式和MySQL搭配使用

元数据服务(metastore)作用是:客户端连接metastore服务,metastore再去连接MySQL数据库来存取元数据。有了metastore服务,就可以有多个客户端同时连接,而且这些客户端不需要知道MySQL数据库的用户名和密码,只需要连接metasto...

2021-10-11
1

2021年大数据Hive(三):手把手教你如何吃透Hive数据库和表操作(学会秒变数仓大佬)

1、CREATE TABLE 创建一个指定名字的表。如果相同名字的表已经存在,则抛出异常;用户可以用 IF NOT EXISTS 选项来忽略这个异常。

2021-10-11
0

2021年大数据Hive(四):Hive查询语法

1、ORDER BY用于全局排序,就是对指定的所有排序键进行全局排序,使用ORDER BY的查询语句,最后会用一个Reduce Task来完成全局排序。解释:

2021-10-11
1

2021年大数据Hive(六):Hive的表生成函数

explode(col):将hive一列中复杂的array或者map结构拆分成多行。 explode(ARRAY) 数组的每个元素生成一行 explode(MAP) map中每个key-value对,生成一行,key为一列,value为一列...

2021-10-11
0

2021年大数据Hive(七):Hive的开窗函数

DENSE_RANK() 生成数据项在分组中的排名,排名相等会在名次中不会留下空位

2021-10-11
0

2021年大数据Hive(八):Hive自定义函数

Hive 自带了一些函数,比如:max/min等,但是数量有限,自己可以通过自定义UDF来方便的扩展。

2021-10-11
0

2021年大数据Hive(九):Hive的数据压缩

在实际工作当中,hive当中处理的数据,一般都需要经过压缩,可以使用压缩来节省我们的MR处理的网络带宽

2021-10-11
1

2021年大数据Hive(十):Hive的数据存储格式

Hive支持的存储数的格式主要有:TEXTFILE(行式存储) 、SEQUENCEFILE(行式存储)、ORC(列式存储)、PARQUET(列式存储)。

2021-10-11
0