最新 最热

腾讯新闻基于 Flink PipeLine 模式的实践

接下来我们将介绍基于腾讯云流计算 Oceanus Flink 平台、PipeLine 设计模式搭建的实时数据仓库思想。该方案已经落地内容商业化新闻如广告实时广告停单、实时报表、实时特征计算、游戏联运行为分析、数据异常检测等场...

2021-12-15
1

基于Flink+ClickHouse打造轻量级点击流实时数仓

Flink 和 ClickHouse 分别是实时计算和 OLAP 领域的翘楚,也是近些年非常火爆的开源框架,很多大厂都在将两者结合使用来构建各种用途的实时平台,效果很好。关于两者的优点就不再赘述,本文来简单介绍笔者团队在点击流实时数...

2021-12-15
1

Flink CDC 2.0 数据处理流程全面解析

8月份 FlinkCDC 发布2.0.0版本,相较于1.0版本,在全量读取阶段支持分布式读取、支持checkpoint,且在全量 + 增量读取的过程在不锁表的情况下保障数据一致性。...

2021-12-15
1

Flink TaskManager 内存模型

在 Flink 1.12.0 版本中对 UI 进行了改进,在 TM 的页面增加了一个内存模型图,清楚的显示了每个区域的内存配置以及使用情况.

2021-12-15
1

Calcite 语法拓展

从Flink源码flink-table/flink-sql-parser/src/main/codegen文件夹copy到自己项目的src/main目录下

2021-12-15
1

腾讯新闻基于 Flink PipeLine 模式的实践

摘要   随着社会消费模式以及经济形态的发展变化,将催生新的商业模式。腾讯新闻作为一款集游戏、教育、电商等一体的新闻资讯平台、服务亿万用户,业务应用多、数据量大。加之业务增长、场景更加复杂,业务对实时计算高...

2021-12-15
1

腾讯新闻基于Flink PipeLine模式的实践

本文作者:腾讯新闻商业化数据高级工程师 罗强 摘要   随着社会消费模式以及经济形态的发展变化,将催生新的商业模式。腾讯新闻作为一款集游戏、教育、电商等一体的新闻资讯平台、服务亿万用户,业务应用多、数据量大。...

2021-12-15
1

【最全的大数据面试系列】Flink面试题大全

spark streaming 的 checkpoint 仅仅是针对 driver 的故障恢复做了数据和元数据的checkpoint。而 flink 的 checkpoint 机制 要复杂了很多,它采用的是轻量级的分布式快照,实现了每个算子的快照,及流动中的数据的快照。...

2021-12-15
1

算法岗机器学习相关问题整理(大数据部分)

MapReduce是apache公司开发的,基于该框架能够使应用程序能够运行在大规模集群上,并以一种可靠的,具有容错能力的方式并行地处理上TB级别的海量数据集。MapReduce的思想就是“分而治之”,Mapper负责“分”,即把复杂的任务分...

2021-12-14
1

Log4j爆核弹级漏洞,大厂中招、公司炸锅了...

出处:https://www.zhihu.com/question/505025655/answer/2265086040

2021-12-13
1