2021年大数据Hive(六):Hive的表生成函数

2021-10-11 15:40:16 浏览数 (1)

Hive的表生成函数

一、explode函数

explode(col):将hive一列中复杂的array或者map结构拆分成多行。 explode(ARRAY) 数组的每个元素生成一行 explode(MAP) map中每个key-value对,生成一行,key为一列,value为一列

数据:

10 CLARK|KING|MILLER 20 SMITH|JONES|SCOTT|ADAMS|FORD 30 ALLEN|WARD|MARTIN|BLAKE|TURNER|JAMES

建表:

代码语言:javascript复制
create table emp2(
deptno int,
names array<string>
)
row format delimited fields terminated by 't'
collection items terminated by '|';

插入数据

代码语言:javascript复制
load data local inpath '/export/data/hivedatas/emp2.txt' into table emp2;

查询数据

代码语言:javascript复制
select * from emp;

使用expload查询

代码语言:javascript复制
select explode(names) as name from emp;

二、LATERAL VIEW侧视图

LATERAL VIEW 用法:LATERAL VIEW udtf(expression) tableAlias AS columnAlias 解释:用于和split, explode等UDTF一起使用,它能够将一列数据拆成多行数据,在此基础上可以对拆分后的数据进行聚合。

列转行

代码语言:javascript复制
select deptno,name from emp2 lateral view explode(names) tmp_tb as name;

三、Reflect函数

reflect函数可以支持在sql中调用java中的自带函数

1、使用java.lang.Math当中的Max求两列中最大值

创建hive表

代码语言:javascript复制
create table test_udf(col1 int,col2 int) row format delimited fields terminated by ',';

–准备数据 test_udf.txt

1,2 4,3 6,4 7,5 5,6

–加载数据

代码语言:javascript复制
load data local inpath '/export/data/hivedatas/test_udf.txt'  into table test_udf;

–使用java.lang.Math当中的Max求两列当中的最大值

代码语言:javascript复制
select reflect("java.lang.Math","max",col1,col2) from test_udf;