最新 最热

正面超越Spark | 几大特性垫定Flink1.12流计算领域真正大规模生产可用(下)

我们书接上文,我们在之前的文章《正面超越Spark | 几大特性垫定Flink1.12流计算领域真正大规模生产可用(上)》详细描述了Flink的生产级别Flink on K8s高可用方案和DataStream API 对批执行模式的支持。...

2021-02-05
0

Hive的基本概念

文章目录Hive简介什么是Hive为什么使用Hive?Hive的特点Hive的缺点Hive架构架构图基本组成Hive与Hadoop的关系Hive简介什么是Hive Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提...

2021-02-05
1

Hive与传统数据库对比

由于Hive采用了SQL的查询语言HQL,因此很容易将Hive理解为数据库。其实从结构上来看,Hive和数据库除了拥有类似的查询语言,再无类似之处。数据库可以用在Online的应用中,但是Hive是为数据仓库而设计的,清楚这一点,有助于从应...

2021-02-05
1

HIVE的安装部署

在每一个节点上安装hive,每一个hive是拥有一套自己的元数据,每个节点的库,表就不统一。所以安装一个MySQL让其他的节点都连接这一个MySQL。

2021-02-05
0

hive自定义函数之java代码

文章目录创建maven项目,导入jar包创建一个java类将项目打包,上传到集群上在hive里添加jar包使用自定义函数创建maven项目,导入jar包<repositories> <repository> <id>cloudera</id> ......

2021-02-05
0

hive中外部表、内部表、分区表、分桶表

create table student(t_id string,t_name string) row format delimited fields terminated by ‘t’; 加载数据 ( /export/servers/hivedatas/student .csv 数据在虚拟机上地址) load ...

2021-02-05
0

Hive基本操作之数据库操作与数据库表的操作

可以使用alter database 命令来修改数据库的一些属性。但是数据库的元数据信息是不可更改的,包括数据库的名称以及数据库所在的位置

2021-02-05
0

impala的介绍

impala是 cloudera提供的一款高效率的sql查询工具,提供实时的查询效果,官方测试性能比hive快10到100倍,其sql查询比sparkSQL还要更加快速,号称是当前大数据领域最快的查询sql工具。...

2021-02-05
1

impala的安装部署

hive安装包scp在所有需要安装impala的节点上,因为impala需要引用hive的依赖包。

2021-02-05
0

企业是如何选择技术栈来做离线数仓

最近在跟一位粉丝聊天,聊起来了做离线数仓时该用那些技术栈。于是根据我的经验和参考一些资料于就有本篇文章。在这里我会分享三个案例,仅供参考。...

2021-02-04
0