2020 年 Java 篇:蚂蚁金服、拼多多,小米 java 面试几轮
说说 Spring 的生命周期吧
说说 GC 的过程(说了 young gc 和 full gc 的触发条件和回收过程以及对象创建的过程)
CMS GC 有什么问题?(并发清除算法,浮动垃圾,短暂停顿)
怎么避免产生浮动垃圾?(记得有个 VM 参数设置可以让扫描新生代之前进行一次 young gc,但是因为 gc 是虚拟机自动调度的,所以不保证一定执行。但是还有参数可以让虚拟机强制执行一次 young gc)
强制 young gc 会有什么问题?(STW 停顿时间变长)
知道 G1 么?(了解一点 )
回收过程是怎么样的?(young gc、并发阶段、混合阶段、full gc,说了 Remember Set)
你提到的 Remember Set 底层是怎么实现的?
有什么想问的么?
五面
五面是 HRBP 面的,和我提前预约了时间,主要聊了之前在蚂蚁的实习经历、部门在做的事情、职业发展、福利待遇等。阿里面试官确实是具有一票否决权的,很看重你的价值观是否 match,一般都比较喜欢皮实的候选人。HR 面一定要诚实,不要说谎,只要你说谎 HR 都会去证实,直接 cut 了。
之前蚂蚁实习三个月怎么不留下来?
实习的时候主管是谁?
实习做了哪些事情?(尼玛这种也问?)
你对技术怎么看?平时使用什么技术栈?(阿里 HR 真的是既当爹又当妈,)
最近有在研究什么东西么
你对 SRE 怎么看
对待遇有什么预期么
最后 HR 还对我说目前稳定性保障部挺缺人的,希望我尽快回复。
小结
蚂蚁面试比较重视基础,所以 Java 那些基本功一定要扎实。蚂蚁的工作环境还是挺赞的,因为我面的是稳定性保障部门,还有许多单独的小组,什么三年 1 班,很有青春的感觉。面试官基本水平都比较高,基本都 P7 以上,除了基础还问了不少架构设计方面的问题,收获还是挺大的。
==========================================================================
面试前
面完蚂蚁后,早就听闻拼多多这个独角兽,决定也去面一把。首先我在脉脉找了一个拼多多的 HR,加了微信聊了下,发了简历便开始我的拼多多面试之旅。这里要非常感谢拼多多 HR 小姐姐,从面试内推到 offer 确认一直都在帮我,人真的很 nice。
一面
为啥蚂蚁只待了三个月?没转正?(转正了,解释了一通。。。)
Java 中的 HashMap、TreeMap 解释下?(TreeMap 红黑树,有序,HashMap 无序,数组+链表)
TreeMap 查询写入的时间复杂度多少?(O(logN))
HashMap 多线程有什么问题?(线程安全,死锁)怎么解决?( jdk1.8 用了 synchronize + CAS,扩容的时候通过 CAS 检查是否有修改,是则重试)重试会有什么问题么?(CAS(Compare And Swap)是比较和交换,不会导致线程阻塞,但是因为重试是通过自旋实现的,所以仍然会占用 CPU 时间,还有 ABA 的问题)怎么解决?(超时,限定自旋的次数,ABA 可以通过原理变量 AtomicStampedReference 解决,原理利用版本号进行比较)超过重试次数如果仍然失败怎么办?(synchronize 互斥锁)
CAS 和 synchronize 有什么区别?都用 synchronize 不行么?(CAS 是乐观锁,不需要阻塞,硬件级别实现的原子性;synchronize 会阻塞,JVM 级别实现的原子性。使用场景不同,线程冲突严重时 CAS 会造成 CPU 压力过大,导致吞吐量下降,synchronize 的原理是先自旋然后阻塞,线程冲突严重仍然有较高的吞吐量,因为线程都被阻塞了,不会占用 CPU )
如果要保证线程安全怎么办?(ConcurrentHashMap)
ConcurrentHashMap 怎么实现线程安全的?(分段锁)
get 需要加锁么,为什么?(不用,volatile 关键字)
volatile 的作用是什么?(保证内存可见性)
底层怎么实现的?(说了主内存和工作内存,读写内存屏障,happen-before,并在纸上画了线程交互图)
在多核 CPU 下,可见性怎么保证?(思考了一会,总线嗅探技术)
聊项目,系统之间是怎么交互的?
系统并发多少,怎么优化?
给我一张纸,画了一个九方格,都填了数字,给一个 MN 矩阵,从 1 开始逆时针打印这 MN 个数,要求时间复杂度尽可能低(内心 OS:之前貌似碰到过这题,最优解是怎么实现来着)思考中。。。
可以先说下你的思路(想起来了,说了什么时候要变换方向的条件,向右、向下、向左、向上,依此循环)
有什么想问我的?
二面
自我介绍下
手上还有其他 offer 么?(拿了蚂蚁的 offer)
部门组织结构是怎样的?(这轮不是技术面么,不过还是老老实实说了)
系统有哪些模块,每个模块用了哪些技术,数据怎么流转的?(面试官有点秃顶,一看级别就很高)给了我一张纸,我在上面简单画了下系统之间的流转情况
链路追踪的信息是怎么传递的?(RpcContext 的 attachment,说了 Span 的结构:parentSpanId + curSpanId)
SpanId 怎么保证唯一性?(UUID,说了下内部的定制改动)
RpcContext 是在什么维度传递的?(线程)
Dubbo 的远程调用怎么实现的?(讲了读取配置、拼装 url、创建 Invoker、服务导出、服务注册以及消费者通过动态代理、filter、获取 Invoker 列表、负载均衡等过程(哗啦啦讲了 10 多分钟),我可以喝口水么)
Spring 的单例是怎么实现的?(单例注册表)
为什么要单独实现一个服务治理框架?(说了下内部刚搞微服务不久,主要对服务进行一些监控和性能优化)
谁主导的?内部还在使用么?
逆向有想过怎么做成通用么?
有什么想问的么?
三面
二面老大面完后就直接 HR 面了,主要问了些职业发展、是否有其他 offer、以及入职意向等问题,顺便说了下公司的福利待遇等,都比较常规啦。不过要说的是手上有其他 offer 或者大厂经历会有一定加分。
小结
拼多多的面试流程就简单许多,毕竟是一个成立三年多的公司。面试难度中规中矩,只要基础扎实应该不是问题。但不得不说工作强度很大,开始面试前 HR 就提前和我确认能否接受这样强度的工作,想来的老铁还是要做好准备
===========================================================================
面试前
头条的面试是三家里最专业的,每次面试前有专门的 HR 和你约时间,确定 OK 后再进行面试。每次都是通过视频面试,因为都是之前都是电话面或现场面,所以视频面试还是有点不自然。也有人觉得视频面试体验很赞,当然萝卜青菜各有所爱。最坑的二面的时候对方面试官的网络老是掉线,最后很冤枉的挂了(当然有一些点答得不好也是原因之一)。所以还是有点遗憾的。
一面
先自我介绍下
聊项目,逆向系统是什么意思
聊项目,逆向系统用了哪些技术
线程池的线程数怎么确定?
如果是 IO 操作为主怎么确定?
如果计算型操作又怎么确定?
Redis 熟悉么,了解哪些数据结构?(说了 zset) zset 底层怎么实现的?(跳表)
跳表的查询过程是怎么样的,查询和插入的时间复杂度?(说了先从第一层查找,不满足就下沉到第二层找,因为每一层都是有序的,写入和插入的时间复杂度都是 O(logN))
红黑树了解么,时间复杂度?(说了是 N 叉平衡树,O(logN))
既然两个数据结构时间复杂度都是 O(logN),zset 为什么不用红黑树(跳表实现简单,踩坑成本低,红黑树每次插入都要通过旋转以维持平衡,实现复杂)
点了点头,说下 Dubbo 的原理?(说了服务注册与发布以及消费者调用的过程)踩过什么坑没有?(说了 dubbo 异常处理的和打印 accesslog 的问题)
CAS 了解么?(说了 CAS 的实现)还了解其他同步机制么?(说了 synchronize 以及两者的区别,一个乐观锁,一个悲观锁)
那我们做一道题吧,数组 A,2*n 个元素,n 个奇数、n 个偶数,设计一个算法,使得数组奇数下标位置放置的都是奇数,偶数下
标位置放置的都是偶数
先说下你的思路(从 0 下标开始遍历,如果是奇数下标判断该元素是否奇数,是则跳过,否则从该位置寻找下一个奇数)
下一个奇数?怎么找?(有点懵逼,思考中。。)
有思路么?(仍然是先遍历一次数组,并对下标进行判断,如果下标属性和该位置元素不匹配从当前下标的下一个遍历数组元素,然后替换)
你这样时间复杂度有点高,如果要求 O(N)要怎么做(思考一会,答道“定义两个指针,分别从下标 0 和 1 开始遍历,遇见奇数位是是偶数和偶数位是奇数就停下,交换内容”)
时间差不多了,先到这吧。你有什么想问我的?
二面
面试官和蔼很多,你先介绍下自己吧
你对服务治理怎么理解的?
项目中的限流怎么实现的?(Guava ratelimiter,令牌桶算法)
具体怎么实现的?(要点是固定速率且令牌数有限)
如果突然很多线程同时请求令牌,有什么问题?(导致很多请求积压,线程阻塞)
怎么解决呢?(可以把积压的请求放到消息队列,然后异步处理)
如果不用消息队列怎么解决?(说了 RateLimiter 预消费的策略)
分布式追踪的上下文是怎么存储和传递的?(ThreadLocal + spanId,当前节点的 spanId 作为下个节点的父 spanId)
Dubbo 的 RpcContext 是怎么传递的?(ThreadLocal)主线程的 ThreadLocal 怎么传递到线程池?(说了先在主线程通过 ThreadLocal 的 get 方法拿到上下文信息,在线程池创建新的 ThreadLocal 并把之前获取的上下文信息设置到 ThreadLocal 中。这里要注意的线程池创建的 ThreadLocal 要在 finally 中手动 remove,不然会有内存泄漏的问题)
你说的内存泄漏具体是怎么产生的?(说了 ThreadLocal 的结构,主要分两种场景:主线程仍然对 ThreadLocal 有引用和主线程不存在对 ThreadLocal 的引用。第一种场景因为主线程仍然在运行,所以还是有对 ThreadLocal 的引用,那么 ThreadLocal 变量的引用和 value 是不会被回收的。第二种场景虽然主线程不存在对 ThreadLocal 的引用,且该引用是弱引用,所以会在 gc 的时候被回收,但是对用的 value 不是弱引用,不会被内存回收,仍然会造成内存泄漏)
线程池的线程是不是必须手动 remove 才可以回收 value?(是的,因为线程池的核心线程是一直存在的,如果不清理,那么核心线程的 threadLocals 变量会一直持有 ThreadLocal 变量)
那你说的内存泄漏是指主线程还是线程池?(主线程 )
可是主线程不是都退出了,引用的对象不应该会主动回收么?(面试官和内存泄漏杠上了),沉默了一会。。。
那你说下 SpringMVC 不同用户登录的信息怎么保证线程安全的?(刚才解释的有点懵逼,一下没反应过来,居然回答成锁了。大脑有点晕了,此时已经一个小时过去了,感觉情况不妙。。。)
这个直接用 ThreadLocal 不就可以么,你见过 SpringMVC 有锁实现的代码么?(有点晕菜。。。)
我们聊聊 mysql 吧,说下索引结构(说了 B+树)
为什么使用 B+树?( 说了查询效率高,O(logN),可以充分利用磁盘预读的特性,多叉树,深度小,叶子结点有序且存储数据)
什么是索引覆盖?(忘记了。。。)
评论