前言
有没有去面试的时候被问到Flink的面试题你答不上来,为什么那?,菜吗?不是。原因是你接触的面试题太少了,那我今天就根据不同的群体来给大家你分享。
1 Flink基础(适合初入职场)
- 简单介绍一下 Flink
- Flink相比传统的Spark Streaming区别?
- Flink的组件栈有哪些?
- Flink 的运行必须依赖 Hadoop组件吗?
- 你们的Flink集群规模多大?
- Flink的基础编程模型了解吗?
- Flink集群有哪些角色?各自有什么作用?
- 说说 Flink 资源管理中 Task Slot 的概念
- 说说 Flink 的常用算子?
- 说说你知道的Flink分区策略?
- Flink的并行度了解吗?Flink的并行度设置是怎样的?
- Flink的Slot和parallelism有什么区别?
- Flink有没有重启策略?说说有哪几种?
- 用过Flink中的分布式缓存吗?如何使用?
- 说说Flink中的广播变量,使用时需要注意什么?
- 说说Flink中的窗口?
- 说说Flink中的状态存储?
- Flink中的时间有哪几类
- Flink 中水印是什么概念,起到什么作用?
- Flink Table & SQL 熟悉吗?TableEnvironment这个类有什么作用
- Flink SQL的实现原理是什么?是如何实现 SQL 解析的呢?
2 Flink中级 (适合1~2年开发经验的人)
- Flink是如何支持批流一体的?
- Flink是如何做到高效的数据交换的?
- Flink是如何做容错的?
- Flink 分布式快照的原理是什么?
- Flink是如何保证Exactly-once语义的?
- Flink 的 kafka 连接器有什么特别的地方?
- 说说 Flink的内存管理是如何做的?
- 说说 Flink的序列化如何做的?
- Flink中的Window出现了数据倾斜,你有什么解决办法?
- Flink中在使用聚合函数 GroupBy、Distinct、KeyBy 等函数时出现数据热点该如何解决?
- Flink任务延迟高,想解决这个问题,你会如何入手?
- Flink是如何处理反压的?
- Flink的反压和Strom有哪些不同?
- Operator Chains(算子链)这个概念你了解吗?
- Flink什么情况下才会把Operator chain在一起形成算子链?
- 说说Flink1.9的新特性?
- 消费kafka数据的时候,如何处理脏数据?
3 Flink高级 (适合3年以上)
- Flink Job的提交流程
- Flink所谓"三层图"结构是哪几个"图"?
- JobManger在集群中扮演了什么角色?
- JobManger在集群启动过程中起到什么作用?
- TaskManager在集群中扮演了什么角色?
- TaskManager在集群启动过程中起到什么作用?
- Flink 计算资源的调度是如何实现的?
- 简述Flink的数据抽象及数据交换过程?
- Flink 中的分布式快照机制是如何实现的?
- 简单说说FlinkSQL的是如何实现的?
4 企业面试题(重点)
- 应用架构
- 压测和监控
- 有了Spark还为什么用 Flink
- checkpoint 的存储
- exactly-once 的保证
- 状态机制
- 海量 key 去重
- checkpoint 与 spark 比较
- watermark 机制
- exactly-once 如何实现
- CEP
- 三种时间语义
- 数据高峰的处理
小结
好今天的Flink的题目就分享到这里,背过上面的那些题目害怕面试官提问?信自己,努力和汗水总会能得到回报的。我是大数据老哥,我们下期见~~~
答案获取:https://github.com/lhh2002/Framework-Of-BigData