Hive

2021-03-05 10:05:45 浏览数 (1)

Hive

运行方式

命令行

脚本

jdbc

webui

搭建模式

local

单用户模式

远程模式/多用户模式

一般模式

Beeline

· 服务器hiveserver2启动

· 客户端beeline连接

HQL

建表(create)

内部表

· hive管理,删除表时源数据消失

外部表

· 非hive管理,删除表时源数据不消失

查看表描述(desc)

DML

和sql基本类似,用到查询即可

分区

静态分区

动态分区

分桶

适用场景

抽样

map-join

索引

提高检索性能

SerDe

用于序列化与反序列化

构建数据存储和执行引擎之间用于解耦

用于hive和hbase的交互中

JDBC

默认端口10000

Hive函数

内置函数

自定义函数

继承udf或者udaf

重写evaluate方法

参数

配置文件

set命令

hive cli时设置(一次性)

Lateral View

解决多个udaf的使用问题

视图

和关系型数据库类似,相当与建立子查询,不过只有调用视图的时候才会使用

权限管理

元数据信息需要连接mysql存储

0 人点赞