写点什么

面试指南 | 终于要跟大家见面了,我有点紧张。

用户头像
Apache Flink
关注
发布于: 2020 年 05 月 06 日
面试指南 | 终于要跟大家见面了,我有点紧张。

面试,一个令人大多数同学头疼的问题,要么成功进入心仪公司,要么沮丧与其失之交臂。但是,如果能在面试前就能知道面试官将会问的问题,然后可以好好提前准备,这种感觉是不是特别棒?

之前社区帮大家汇总了目前 15 家重量级公司的招聘需求更新在社区招聘帖,也收到了很多同学的反馈:

“投了一堆简历,但是都没面试机会”

“面试官说是想招高阶人才”

“哎,感觉像我这种毕业年限短,

公司又是小公司,本科也不太好的,找工作太难了”

最后只能总结:

“我不优秀,我连面试机会都没有



也太南南南了!

那么究竟怎么积累技术实力,成为 Flink 高级开发,拿下心仪公司的 offer 呢?小松鼠征集了 Flink 用人主管的核心诉求并提供一份超级清晰、实用的学习路径。虽然我们都不会读心术,但破解面试难题也有思路可寻!

Tips:2020 Flink 最新招聘信息查看请见下方链接,内推或有招聘需求的公司可联系小松鼠(微信ID:Ververica2019)投递 JD~



2020 最新 Flink 招聘岗位汇总:

https://juejin.im/post/5df9e25fe51d4557f5450274



了解用人主管的需求

在收集招聘信息时小松鼠了解到用人主管的核心需求以及面试了部分同学之后的感受,总结下来主要分为以下方面:

  1. 经验都偏少,缺乏复杂场景的历练

  2. 在用 Flink 做数据开发,但没有底层修改经验

  3. 想招比较高阶的对 Flink 底层有深入研究的同学,但是高阶的太难找

  4. 需要有深入研究、改造经验的也可以,独立完成问题排查与任务调优

请注意关键词!「复杂场景历练」、「底层修改经验」、「高阶」、「问题排查与调优」,这是当前大多数岗位对 Flink 开发同学的预期,相当于划重点呐!除了解用人主管的核心需求外,我们也需要结合自身基础,找对合适的岗位方向。

  

找对岗位方向

小松鼠总结了市面上大多数招聘内容,对这些岗位进行分析并整合,可以看到如下表格内容。总体上分为3个方向:



方向

岗位

核心要求

平台类

大数据实时处理平台开发

  • 扎实的基础语言:Java/Python/Scala/Golang/C++

  • Flink 使用经验

  • 熟悉 Hadoop 生态圈的开源软件,有相关开发经验或源码及内部实现者加分

OLAP平台开发

实时计算平台开发

事件处理平台开发

技术 / 引擎类

分布式计算研发

  • 扎实的基础语言:Java/Python/Scala/Golang/C++

  • Flink 应用经验及原理了解

  • 开源社区活跃者加分

  • 能够进行性能及稳定性诊断,具备大数据组件改进经验、调优、PB 级大数据生产环境经验加分

  • 熟悉 Flink 生态加分

实时计算研发

大数据研发

流式计算研发

大数据基础架构

业务类

实时数仓开发

  • 扎实的基础语言:Java/Python/Scala/Golang/C++

  • Flink 基础的运行机制和原理

  • 底层基础库优化经验、开源大数据系统有 SQL、分布式机器学习算法开发、数据建模、机器学习等经验加分

推荐引擎

流媒体

(不完全统计,仅供参考)

众所周知,平台开发或底层引擎开发都需要对 Flink 有钻研精神,需要持续专注地深耕,对技术深度、技术原理掌握甚至是源码能力要求都较高。

相对而言,业务类的开发则更关注具体应用场景,大多是在平台的基础上进行业务场景的应用开发,对底层、源码的要求相对较低。

总体上,无论选择哪种技术方向,扎实的语言功底都是基础,而对开源社区的贡献、对 Flink 生态有深入了解等都将成为 blingbling 的加分项。

  

从小白到 Flink 高级开发,应该掌握哪些技术?

如果你了解到自己与用人主管的核心需求存在哪些差异,或者有自己倾向的岗位方向,那么恭喜你已成功完成心理建设。第三部分,小松鼠邀请了 Apache Flink PMC 程鹤群(军长)来帮大家解决“从小白到 Flink 高级开发,应该掌握哪些技术?”这个核心问题,此处感谢 Apache Flink PMC 伍翀(云邪)的反馈与建议。

首先,送你一份 X-mind!公众号后台回复关键字「面试」,可以下载 PDF 版本~



然后,我们来了解这份思维导图的构成以及如何使用。

1.专治无从下手

根据 Flink 相关招聘岗位要求,我们将重点分为以下部分:

  • 大数据基础理论

  • SQL & Table

  • Runtime

  • Flink 生态

  • Flink 实战



整合了当前 Flink 面试岗位中涉及的绝大多数知识点,并分为五大板块。除了 SQL & Table、Runtime 等硬核内容外,生态以及实战是面试中需要重点关注的内容。

2.没有问题的思维导图不是好题库

  • 从问题开始,每块内容都以问题的形式帮你回顾可能考察的知识点。

  • 不仅是 Flink,思维导图对面试中可能涉及的数据基础理论也整理成问题供大家参考。

  • 难易分明,Flink 生态以及实战部分不仅是重点也是大部分难点所在,脑图中相应部分也用笑脸标示,难易程度一眼分明。

希望这份思维导图能够对你有所帮助!大家可以结合之前的 Flink 知识图谱一起学习,效果更佳哦~



Flink 社区知识图谱:

https://ververica.cn/developers/special-issue/



跟 5 位大厂同学聊了聊,他们分享了 10 道真题

面试跟从小到大我们经历的大大小小的考试异曲同工,虽然可以临时抱佛脚,可最核心最重要的还是技术实力。下面分享 10 道真题,都来自于生产环境经验丰富的大厂同学,希望对大家面试有所帮助。此处感谢五位同学!

BTW,以下真题仅供大家参考,开拓思路,切不可本末倒置,将真题作为面试准备的唯一法宝。

▼ 真题集 ▼

1.阐述 Flink 如何处理反压,相比 Storm,Spark  Streaming 提供的反压机制,描述其实现有什么不同?

2.阐述流处理引擎提供的三种数据处理语义,解释 Flink  Checkpoint 机制如何保证 Flink 程序结果的 Exactly-Once 语义,描述如何通过两阶段提交协议提供端到端的 Exactly-Once 保证?结合 Kafka 如何构建端到端的 Exactly-Once 处理?

3.阐述 Flink 提供的容错机制,解释分布式快照 Chandy  Lamport 算法逻辑,剖析 Flink  Checkpoint 具体实现流程?

4.如何处理 Flink 作业频繁重启问题?

5.如何优化大状态的 Flink 作业?6.如何排查 Flink Checkpoint 超时问题?7.如何处理 Flink 作业中的数据倾斜问题?

8.Flink 反压机制,如何排查反压瓶颈在哪,及如何处理反压问题?

9.哪种 join 可以满足单个流断流的时候仍然能够保证正确的 join 到数据?

10.watermark 是怎么生成和传递的?

以上。真题集部分还有后续,下期更新~我们的目标是“Flink 学得好,工作容易找”!无论您是面试者想要帮忙内推还是企业用人主管想要招聘,欢迎联系小松鼠(微信ID:Ververica2019)。

点击「阅读原文」可查看 2020 社区最新招聘信息汇总~


关注 Flink 中文社区,获取更多技术干货



用户头像

Apache Flink

关注

Apache Flink 中文社区 2020.04.29 加入

公众号:Flink中文社区 Apache Flink 官方帐号,Flink PMC 维护

评论

发布
暂无评论
面试指南 | 终于要跟大家见面了,我有点紧张。