写点什么

2022 携程提前批大数据一二 (oc) 面经

  • 2022 年 5 月 23 日
  • 本文字数:1136 字

    阅读完需:约 4 分钟

2022 携程提前批大数据一二(oc) 面经

前言

         卷友们,大家好 ~ 我是梦想家 Alex 。最近原创更新频率挺高,主要还是感谢群友们的积极投稿,让我能得到这么多珍贵的素材,才有机会展示给大家~


        本期内容,我为大家带来的是群友 louwin 在参加 <font color='RoyalBlue'>2022 年 携程提前批大数据面试</font> 后写下的面经。<font color='orange'>如果对大家有所启发,希望能在文末来发三连,感谢大家~</font>


2022 携程提前批大数据一/二面经(oc)

开篇先说明:本次面试的岗位是大数据底层框架工程师,不是大数据分析,数据仓库,数据开发。


个人:双非本硕

一面

时常

45 分钟

问题

因为我有一段大厂实习,所以主要针对我实习问了很久,一切问题都结合实习进行提问,所以要是没接触过没关系,咱们实习的内容不一样。而且因为当时暑期实习也是这个面试官面试的,所以基础的问题也没有怎么问。


  • 实习做了什么,有什么收获

  • 对于 presto 的理解,和 hive/spark 有什么不同

  • 对 sparksql 调优有没有遇到,实际情况是什么

  • 对框架 apache atlas 的理解


然后大概就是我表示很有缘,为啥后面没去(二面,一面时间隔得太久了当时),聊一下他们组正在干的事情,让我回去有空可以了解一下 spark3 还有一些别的(这段时间大概 20 分钟,心里已经很稳了)

感受

很棒,没有迟到

二面

时长

1h45min,是的,你没看错,就是这么久,哎。

问题

时间过去有些久了,要是遗忘了请见谅。问题顺序也是乱的,不要在意这些细节。


  • 自己平时用哪些编程语言

  • ArrayList 和 LinkedList 什么时候该用哪个:自己稍微解释一下就行,有自己的理解就好,不需要背课文

  • ArrayList 有上限么,如果有,能给出解决方方案么:我给了分布式存储和 spark 中压缩存储的方法这两个策略

  • jvm gc 常见的方法:那几个概念稍微说一下就行,面试官知道你实际中没用过

  • 如何判断发生了数据倾斜,有哪些情况会引起倾斜

  • 如何找出在哪个部分发生了数据倾斜

  • 如何在 map/reduce 端发生倾斜后,快速定位到出问题的表或者文件

  • spark3 新特性有哪些

  • spark3 新特性在实际工作中有关注过么

  • presto 和 hive/spark 区别,并且实际编写中有遇到什么困难:再次问到

  • apache atlas:我介绍了如何监控元数据并且传递变化信息

  • 数据治理一些常见的框架的交流和分析:有一些框架知道你没看过,只是想问你觉得会如何设计,比如如果实现一个对 sql 单元测试的模块,怎么设计

  • mr job 有没有写过,基本流程是什么

  • 一道智力题:和位运算有关

感受

        很棒,没有迟到。而且问的其实大部分都不是之后工作可能接触最多的内容,问的很多还是偏向我实习的这部分,更多的想了解你的潜力,而不是你和我的岗位是不是完全匹配,所以会发现问的问题包含很多数仓的(实习做的数仓),这是我心中面试官的样子,不是拿个套路问问问的类型,看中的是人,而不是人会的技能,技能可以学,人变不了。


      

发布于: 刚刚阅读数: 3
用户头像

还未添加个人签名 2020.09.07 加入

还未添加个人简介

评论

发布
暂无评论
2022 携程提前批大数据一二(oc) 面经_大数据_大数据梦想家_InfoQ写作社区