最新 最热

当大数据架构遇上 TiDB

一年前,知乎的大数据架构与 TiDB 首次相遇,那时我们将 Hive MetaStore 的元数据库迁移到了 TiDB,得到了超过单机数据库一个量级的性能提升。在见识过分布式 NewSQL 数据库 TiDB 的威力后,我们对它寄予厚望,将它应用到了大...

2021-07-30
0

在所有Spark模块中,我愿称SparkSQL为最强!

我们之前已经学习过了《我们在学习Spark的时候,到底在学习什么?》,这其中有一个关于SQL的重要模块:SparkSQL。

2021-07-30
1

当我们在学习Hive的时候在学习什么?「硬刚Hive续集」

我在之前的硬刚系列《大数据方向另一个十年开启 |《硬刚系列》第一版完结》中写过一个《硬刚Hive | 4万字基础调优面试小总结》,这个小结里基本涵盖了你所看过的关于Hive的常见的知识和面试八股文。...

2021-07-30
1

Flink集成Iceberg小小实战

Apache Iceberg is an open table format for huge analytic datasets. Iceberg adds tables to Presto and Spark that use a high-performance format that works just li...

2021-07-30
0

Hive SQL语句的正确执行顺序

关于 sql 语句的执行顺序网上有很多资料,但是大多都没进行验证,并且很多都有点小错误,尤其是对于 select 和 group by 执行的先后顺序,有说 select 先执行,有说 group by 先执行,到底它俩谁先执行呢?...

2021-07-29
0

安装和体验hive-1.2

Hive是种基于Hadoop的数据仓库工具,将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。

2021-07-28
0

FAQ系列之Impala

Hue 保持查询线程处于活动状态,直到您关闭它。 有一种方法可以在 Hue 上设置超时。

2021-07-27
0

FAQ系列之SDX

CDP私有云基础使用的基础集群不同于 CDP 公有云中 PaaS 风格的 SDX 集群。 从那里,私有云控制计划从控制体验服务的基础集群中的 CM 部署。

2021-07-27
1

[1032]spark-3.0安装和入门

spark官网下载:http://spark.apache.org/downloads.html

2021-07-27
1

如何使用DBeaver连接hive

hive --service metastore & hive --service hiveserver2 &

2021-07-16
1