最新 最热

KLOOK客路旅行基于Apache Hudi的数据湖实践

客路旅行(KLOOK)是一家专注于境外目的地旅游资源整合的在线旅行平台,提供景点门票、一日游、特色体验、当地交通与美食预订服务。覆盖全球100个国家及地区,支持12种语言和41种货币的支付系统,与超过10000家商户合作伙伴紧...

2022-05-18
0

【数据架构】Netflix 万亿级实时数据基础架构的四个创新阶段

我叫徐振中。我于 2015 年加入 Netflix,担任实时数据基础架构团队的创始工程师,后来领导了流处理引擎团队。我在 2010 年代初对实时数据产生了兴趣,从那时起我就相信还有很多价值有待发掘。...

2022-05-17
1

Flink 状态编程

在程序计算过程中,在Flink程序内部存储计算产生的中间结果,并提供给后续Function或算子计算结果使用。(如下图所示)

2022-05-17
1

众安保险:为了实时数据更新,我们把ClickHouse换成了StarRocks

近年来,众安保险致力于加速数据价值向业务价值转化,在“互联⽹+保险⾦融”的双轮驱动下,诞生了数字化转型中专门针对业务数据管理和分析的系统产品——集智。...

2022-05-17
0

【万字长文】Flink cdc源码精讲(推荐收藏)

上面内容主要是以构建source所需要的参数为主,具体我们进入到DebeziumSourceFunction中看看具体实现

2022-05-17
1

Flink灵魂17问,最新面试题

spark streaming 的 checkpoint 仅仅是针对 driver 的故障恢复做了数据和元数据的 checkpoint。而 flink 的 checkpoint 机制 要复杂了很多,它采用的是轻量级的分布式快照,实现了每个算子的快照,及流动中的数据的快照。...

2022-05-17
1

【Flink】小白级入门,Flink sql 的基础用法

对于用户只需要表达我想要什么,具体处理逻辑交给框架,系统处理,用户无需关心,对于一些非专业的开发人员有了解 sql,并且 sql 相对我们学习 java,c 等语言更简单,学习成本更低,如果跨团队,或者非大数据开发人员,也可以...

2022-05-17
1

【BUG】Flink CDC 2.0.0迷之异常!!!

一、场景还原基于 Flink CDC 的 SQL Api 实现实时监听 MySQL 的 binlog 数据发送到 Kafka二、框架版本框架版本Flink1.13.2MySQL5.7.25connector-mysql-cdc2.0.0三、测试代码public class CDCWithSq......

2022-05-17
1

Flink Remote Shuffle 开源:面向流批一体与云原生的 Shuffle 服务

Flink Remote Shuffle 的提出与实现,源自我们观察到的用户对流批一体与云原生日益增加的需求。

2022-05-17
1

【Flink】 WaterMark 详解

在设计上 Flink 认为数据是流式的,批处理只是流处理的特例。同时对数据分为有界数据和无界数据。

2022-05-17
1