最新 最热

Flink集成iceberg在生产环境中的实践

目前我们的大数据系统里,主要承接的业务是部门内的一些业务日志数据的统计、分析等,比如网关日志数据,服务器监控数据,k8s容器的相关日志数据,app的打点日志等。主要的流任务是flink任务是消费kafka的数据,经过各种处理之后...

2021-02-26
0

关于 Lakehouse 的一些笔记和看法

这是最经典的数据仓库模型,模型上面的不多说,可以参考数据仓库理论。从技术角度上来说,

2021-02-24
0

演进式数据架构

本文借助于《演进式架构》这本书中关于演进式架构体系的描述,探索我们如何在数据这个领域,设计出演进式数据架构。

2021-02-08
0

使用CDW启用自助服务业务见解

向中央IT提出的数据仓库服务请求可能需要数周或数月才能完成。大型组织中的中央IT团队面临着因市场复杂性和内部业务线(LoB)需求而引起的IT项目激增。同时,中央IT必须兼顾成本和风险。在数据驱动的组织中,为了履行其章程...

2021-02-07
0

数据湖解决方案关键一环,IceBerg会不会脱颖而出?

小编在之前的详细讲解过关于数据湖的发展历程和现状,《我看好数据湖的未来,但不看好数据湖的现在》 ,在最后一部分中提到了当前数据湖的解决方案中,目前跳的最凶的三巨头包括:Delta、Apache Iceberg 和 Apache Hudi。...

2021-02-05
0

【大数据成神之路】第一版更新完毕

截止目前为止收获3500+Star,1200+Fork。这个仓库建立的初衷的是小编个人学习和面试过程中的一个笔记本,最初的时候简单到只有几个txt,在某一天突然收获了10几个Star,并且有一个妹子居然给我提了一个PR。所以才下定决心把...

2021-02-05
0

一个典型的架构演变案例:金融时报数据平台

本文最初发布于金融时报产品 & 技术博客,经原作者授权由 InfoQ 中文站翻译并分享。

2021-01-20
0

为什么要使用Presto

在本文中我们讨论下你可能已经遇到过的关于数据大规模增长的问题,以及数据被忽略的价值。Presto 是处理所有数据并通过结构化查询语言(SQL)提供行之有效工具的关键推动力。Presto 的设计和功能能够让你获得更好的见解,而...

2021-01-20
0

Flink Forward Asia 2020干货总结!

剩喜漫天飞玉蝶,不嫌幽谷阻黄莺。2020 年是不寻常的一年,Flink 也在这一年迎来了新纪元。

2021-01-07
1

是载体,更是舞台

“传统的IT存储厂商,‘存’是其核心关注点;而互联网企业,不仅要做好‘存’,还要做强‘用’。”

2021-01-05
0