hive_字节宝

实时数仓-Iceberg

互联网技术高速发展的背景下，数据已经成为各大公司的最宝贵资源之一。大数据领域经过近十年的高速发展，无论是离线计算还是实时计算、不管是数据仓库还是数据中台都已深入各大公司的各个业务。在复杂业务的背景下，迫切需...

数据湖 hive 大数据 flink Kafka

2022-06-06

「Hudi系列」Hudi查询&写入&常见问题汇总

2. 「Hudi系列」Apache Hudi入门指南 | SparkSQL+Hive+Presto集成

hive 大数据文件存储数据库 spark

2022-06-05

Apache Hudi 0.11 版本重磅发布，新特性速览!

在 0.11.0 中，默认为 Spark writer 启用具有同步更新的元数据表和基于元数据表的file listing，以提高在大型 Hudi 表上的分区和文件listing的性能。在reader方面，用户需要将其设置为 true 以从中受益。元数据表和相关文...

spark 打包 flink 大数据 hive

2022-06-05

Presto在字节跳动的内部实践与优化

在字节跳动内部，Presto 主要支撑了 Ad-hoc 查询、BI 可视化分析、近实时查询分析等场景，日查询量接近 100 万条。

hive 数据分析日志数据大数据 SQL

2022-06-05

基于Flink1.14 + Iceberg0.13构建实时数据湖实战

Iceberg默认支持Hadoop Catalog。如果需要使用Hive Catalog，需要将flink-sql-connector-hive-3.1.2_2.12-1.14.3.jar放到Flink集群所有服务器的lib目录下，然后重启Flink

flink 大数据 hive 数据库 SQL

2022-06-05

关于大数据的完整讲解

ELT的过程是，在抽取后将结果先写入目的地，然后利用数据库的聚合分析能力或者外部计算框架，如Spark来完成转换

sqlserver hive spark hadoop flink

2022-06-02

面试篇：Hive Sql转换成MapReduce的过程

总结：HiveSQL ->AST(抽象语法树) -> QB(查询块) ->OperatorTree（操作树）->优化后的操作树->mapreduce任务树->优化后的mapreduce任务树。

SQL hive 编程算法 mapreduce

2022-06-01

Postgres by BigSQL and Hadoop_fdw

由于Postgres by BigSQL上有编译好的hadoop_fdw，只需用其pgc命令直接安装，否则要去编译hadoop_fdw源代码，这个编译过程中缺少各种依赖就放弃了，编译参考bulid。...

云数据库postgresql 打包 postgresql hive hadoop

2022-06-01

[1145]Hive导入csv文件

**不可以,需要先导入成textfile,之后再从临时表导入成parquet,**如下

hive 文件存储

2022-05-31

Hive环境搭建 | 数据仓库工具搭建详细过程

hive是基于Hadoop的一个数据仓库的机制。hive数据仓库工具能将结构化的数据文件映射为一张数据库表，并提供SQL查询功能，能将SQL语句转变成MapReduce任务来执行。...

hive mapreduce hadoop 云数据库SQLServer SQL

2022-05-31

46 47 48 49 50

实时数仓-Iceberg

「Hudi系列」Hudi查询&写入&常见问题汇总

Apache Hudi 0.11 版本重磅发布，新特性速览!

Presto在字节跳动的内部实践与优化

基于Flink1.14 + Iceberg0.13构建实时数据湖实战

关于大数据的完整讲解

面试篇：Hive Sql转换成MapReduce的过程

Postgres by BigSQL and Hadoop_fdw

[1145]Hive导入csv文件

Hive环境搭建 | 数据仓库工具搭建详细过程

热门文章

热门手册