2022 携程提前批大数据一二 (oc) 面经
前言
卷友们,大家好 ~ 我是梦想家 Alex 。最近原创更新频率挺高,主要还是感谢群友们的积极投稿,让我能得到这么多珍贵的素材,才有机会展示给大家~
本期内容,我为大家带来的是群友 louwin 在参加 <font color='RoyalBlue'>2022 年 携程提前批大数据面试</font> 后写下的面经。<font color='orange'>如果对大家有所启发,希望能在文末来发三连,感谢大家~</font>
2022 携程提前批大数据一/二面经(oc)
开篇先说明:本次面试的岗位是大数据底层框架工程师,不是大数据分析,数据仓库,数据开发。
个人:双非本硕
一面
时常
45 分钟
问题
因为我有一段大厂实习,所以主要针对我实习问了很久,一切问题都结合实习进行提问,所以要是没接触过没关系,咱们实习的内容不一样。而且因为当时暑期实习也是这个面试官面试的,所以基础的问题也没有怎么问。
实习做了什么,有什么收获
对于 presto 的理解,和 hive/spark 有什么不同
对 sparksql 调优有没有遇到,实际情况是什么
对框架 apache atlas 的理解
然后大概就是我表示很有缘,为啥后面没去(二面,一面时间隔得太久了当时),聊一下他们组正在干的事情,让我回去有空可以了解一下 spark3 还有一些别的(这段时间大概 20 分钟,心里已经很稳了)
感受
很棒,没有迟到
二面
时长
1h45min,是的,你没看错,就是这么久,哎。
问题
时间过去有些久了,要是遗忘了请见谅。问题顺序也是乱的,不要在意这些细节。
自己平时用哪些编程语言
ArrayList 和 LinkedList 什么时候该用哪个:自己稍微解释一下就行,有自己的理解就好,不需要背课文
ArrayList 有上限么,如果有,能给出解决方方案么:我给了分布式存储和 spark 中压缩存储的方法这两个策略
jvm gc 常见的方法:那几个概念稍微说一下就行,面试官知道你实际中没用过
如何判断发生了数据倾斜,有哪些情况会引起倾斜
如何找出在哪个部分发生了数据倾斜
如何在 map/reduce 端发生倾斜后,快速定位到出问题的表或者文件
spark3 新特性有哪些
spark3 新特性在实际工作中有关注过么
presto 和 hive/spark 区别,并且实际编写中有遇到什么困难:再次问到
apache atlas:我介绍了如何监控元数据并且传递变化信息
数据治理一些常见的框架的交流和分析:有一些框架知道你没看过,只是想问你觉得会如何设计,比如如果实现一个对 sql 单元测试的模块,怎么设计
mr job 有没有写过,基本流程是什么
一道智力题:和位运算有关
感受
很棒,没有迟到。而且问的其实大部分都不是之后工作可能接触最多的内容,问的很多还是偏向我实习的这部分,更多的想了解你的潜力,而不是你和我的岗位是不是完全匹配,所以会发现问的问题包含很多数仓的(实习做的数仓),这是我心中面试官的样子,不是拿个套路问问问的类型,看中的是人,而不是人会的技能,技能可以学,人变不了。
版权声明: 本文为 InfoQ 作者【大数据梦想家】的原创文章。
原文链接:【http://xie.infoq.cn/article/03c372acb8c5cd692a133d0cd】。文章转载请联系作者。
评论