最新 最热

hive数据类型转换cast_c语言数据类型的转换

在《Hive内置数据类型》文 章中,我们提到了Hive内置数据类型由基本数据类型和复杂数据类型组成。今天的话题是Hive数据类型之间的转换。同Java语言一样,Hive也包括 隐式转换(implicit conversions)和显式转换(explicitly c...

2022-11-08
1

Hive 核心服务HiveServer2(HS2)的前世今生,最后提供代码实例

之前分享了 Hive 元数据的表,一文搞懂 Hive 元数据的表,数仓开发需要熟悉的,建议收藏

2022-11-08
1

一文搞懂 Hive 元数据的表,数仓开发需要熟悉的,建议收藏

Hive 元数据是 Hive 管理数据的根本所在,其他系统接入 Hive 也是通过元数据服务的。本篇文章主要介绍 Hive 元数据表的基本信息,元数据服务放在下篇文章讲。这里我所说的元数据特指 Hive 元数据库的表。...

2022-11-08
1

hive数据类型有哪些?[通俗易懂]

关系数据库里有表(table),分区,hive里也有这些东西,这些东西在hive技术里称为hive的数据模型。今天本文介绍hive的数据类型,数据模型以及文件存储格式。这些知识大家可以类比关系数据库的相关知识。...

2022-11-08
1

hive 数据类型_sv数据类型

本篇来学习一下Hive中的数据类型,以及如何在Hive SQL中去处理这些数据类型。

2022-11-08
1

基尼系数近似计算:sql (hive)实现 简单高效

如何在python中实现基尼系数计算的两种方法,可以查看我的另一篇文章。两篇文章取数相同,可以结合去看。

2022-11-07
1

数仓拉链表[通俗易懂]

拉链表是一种数据模型,主要是针对数据仓库设计中表存储数据的方式而定义的,顾名思义,所谓拉链,就是记录历史。记录一个事物从开始,一直到当前状态的所有变化的信息。拉链表可以避免按每一天存储所有记录造成的海量存储问题...

2022-11-03
1

漫谈数据仓库之拉链表(原理、设计以及在Hive中的实现)

拉链表是针对数据仓库设计中表存储数据的方式而定义的,顾名思义,所谓拉链,就是记录历史。记录一个事物从开始,一直到当前状态的所有变化的信息。...

2022-11-02
1

Azkaban教程[通俗易懂]

Azkaban是在LinkedIn上创建的用于运行Hadoop作业的批处理工作流作业调度程序。Azkaban通过工作依赖性解决订购问题,并提供易于使用的Web用户界面来维护和跟踪您的工作流程。Azkaban定义了一种KV文件格式来建立任务之间...

2022-11-01
1

解决hudi hms catalog中flink建表,spark无法写入问题

在hudi 0.12.0版本,flink和spark都可以基于hive metastore进行元数据管理,更多信息可参考:hudi HMS Catalog指南。也就是说基于hudi hms catalog,flink建表之后,flink或者spark都可以写,或者spark建表之后,spark或者flink都...

2022-10-31
1