最新 最热

你真的了解ELT和ETL吗?

ETL 和 ELT 有很多共同点,从本质上讲,每种集成方法都可以将数据从源端抽取到数据仓库中,两者的区别在于数据在哪里进行转换。 接下来,我们一起详细地分析一下 ETL 和 ELT各自的优缺点,看看在你们现在的业务中用哪种方式处...

2022-04-08
0

《数据密集型型系统设计》LSM-Tree VS BTree

本文为《数据密集型应用系统设计》的读书笔记第一部分第三章的笔记整理,也是个人认为的这本书第一部分最重要的内容。本文将会针对目前数据库系统两个主要阵营进行展开,分别是采用日志型存储结构高速读写的LSM-Tree和面...

2022-04-08
0

最新大厂数据湖面试题,知识点总结(上万字建议收藏)

本文目录:一、什么是数据湖二、数据湖的发展三、数据湖有哪些优势四、数据湖应该具备哪些能力五、数据湖的实现遇到了哪些问题六、数据湖与数据仓库的区别七、为什么要做数据湖?区别在于?八、数据湖挑战九、湖仓一体十、...

2022-04-07
0

万字详解数据仓库、数据湖、数据中台和湖仓一体

数字化转型浪潮卷起各种新老概念满天飞,数据湖、数据仓库、数据中台轮番在朋友圈刷屏,有人说“数据中台算个啥,数据湖才是趋势”,有人说“再见了数据湖、数据仓库,数据中台已成气候”……...

2022-04-07
1

【数据架构】分布式数据网格作为集中式数据单体的解决方案

企业数据架构师不应构建大型集中式数据平台,而应创建分布式数据网格。 ThoughtWorks 的首席技术顾问 Zhamak Dehghani 在旧金山 QCon 的演讲和相关文章中表示,这种方法的改变需要范式转变。随着数据变得越来越普遍,传统...

2022-04-07
0

Robinhood基于Apache Hudi的下一代数据湖实践

Robinhood 的使命是使所有人的金融民主化。Robinhood 内部不同级别的持续数据分析和数据驱动决策是实现这一使命的基础。我们有各种数据源——OLTP 数据库、事件流和各种第 3 方数据源。需要快速、可靠、安全和以隐私...

2022-04-01
0

Onehouse 对Apache Hudi开源社区的承诺

早些时候,我们宣布了我们的新公司 Onehouse,重磅!基于Apache Hudi的商业公司Onehouse成立,它提供了一个建立在 Apache Hudi(简称"Hudi")之上的托管 Lakehouse 基础。在此博客中,我们的创始人兼首席执行官 Vinoth Chandar(也是...

2022-04-01
0

湖仓一体详解

问题导读1.什么是数据仓库、数据集市和数据湖?2.湖仓一体化为什么诞生?3.湖仓一体化是什么?4.湖仓一体化的好处是什么?0.沃尔玛纸尿裤和啤酒在了解湖仓一体化之前,我们先来看一则有关数据仓库的有趣故事吧~沃尔玛拥有世界...

2022-03-31
0