一年前,知乎的大数据架构与 TiDB 首次相遇,那时我们将 Hive MetaStore 的元数据库迁移到了 TiDB,得到了超过单机数据库一个量级的性能提升。在见识过分布式 NewSQL 数据库 TiDB 的威力后,我们对它寄予厚望,将它应用到了大...
我们之前已经学习过了《我们在学习Spark的时候,到底在学习什么?》,这其中有一个关于SQL的重要模块:SparkSQL。
我在之前的硬刚系列《大数据方向另一个十年开启 |《硬刚系列》第一版完结》中写过一个《硬刚Hive | 4万字基础调优面试小总结》,这个小结里基本涵盖了你所看过的关于Hive的常见的知识和面试八股文。...
Apache Iceberg is an open table format for huge analytic datasets. Iceberg adds tables to Presto and Spark that use a high-performance format that works just li...
关于 sql 语句的执行顺序网上有很多资料,但是大多都没进行验证,并且很多都有点小错误,尤其是对于 select 和 group by 执行的先后顺序,有说 select 先执行,有说 group by 先执行,到底它俩谁先执行呢?...
Hive是种基于Hadoop的数据仓库工具,将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。
Hue 保持查询线程处于活动状态,直到您关闭它。 有一种方法可以在 Hue 上设置超时。
CDP私有云基础使用的基础集群不同于 CDP 公有云中 PaaS 风格的 SDX 集群。 从那里,私有云控制计划从控制体验服务的基础集群中的 CM 部署。
spark官网下载:http://spark.apache.org/downloads.html
hive --service metastore & hive --service hiveserver2 &