2020 年 Java 篇:蚂蚁金服、拼多多、字节跳动的面试总结,mysqlserver 使用教程
事务有哪些特性?(ACID)
怎么理解原子性?(同一个事务下,多个操作要么成功要么失败,不存在部分成功或者部分失败的情况)
乐观锁和悲观锁的区别?(悲观锁假定会发生冲突,访问的时候都要先获得锁,保证同一个时刻只有线程获得锁,读读也会阻塞;乐观锁假设不会发生冲突,只有在提交操作的时候检查是否有冲突)这两种锁在 Java 和 MySQL 分别是怎么实现的?(Java 乐观锁通过 CAS 实现,悲观锁通过 synchronize 实现。mysql 乐观锁通过 MVCC,也就是版本实现,悲观锁可以通过 select… for update 加上排它锁)
HashMap 为什么不是线程安全的?(多线程操作无并发控制,顺便说了在扩容的时候多线程访问时会造成死锁,会形成一个环,不过扩容时多线程操作形成环的问题再 JDK1.8 已经解决,但多线程下使用 HashMap 还会有一些其他问题比如数据丢失,所以多线程下不应该使用 HashMap,而应该使用 ConcurrentHashMap)怎么让 HashMap 变得线程安全?(Collections 的 synchronize 方法包装一个线程安全的 Map,或者直接用 ConcurrentHashMap)两者的区别是什么?(前者直接在 put 和 get 方法加了 synchronize 同步,后者采用了分段锁以及 CAS 支持更高的并发)
jdk1.8 对 ConcurrentHashMap 做了哪些优化?(插入的时候如果数组元素使用了红黑树,取消了分段锁设计,synchronize 替代了 Lock 锁)为什么这样优化?(避免冲突严重时链表多长,提高查询效率,时间复杂度从 O(N)提高到 O(logN))
redis 主从机制了解么?怎么实现的?
有过 GC 调优的经历么?(有点虚,答得不是很好)
有什么想问的么?
三面
简单自我介绍下
监控系统怎么做的,分为哪些模块,模块之间怎么交互的?用的什么数据库?(MySQL)使用什么存储引擎,为什么使用 InnnoDB?(支持事务、聚簇索引、MVCC)
订单表有做拆分么,怎么拆的?(垂直拆分和水平拆分)
水平拆分后查询过程描述下
如果落到某个分片的数据很大怎么办?(按照某种规则,比如哈希取模、range,将单张表拆分为多张表)
哈希取模会有什么问题么?(有的,数据分布不均,扩容缩容相对复杂 )
分库分表后怎么解决读写压力?(一主多从、多主多从)
拆分后主键怎么保证惟一?(UUID、Snowflake 算法)
Snowflake 生成的 ID 是全局递增唯一么?(不是,只是全局唯一,单机递增)
怎么实现全局递增的唯一 ID?(讲了 TDDL 的一次取一批 ID,然后再本地慢慢分配的做法)
Mysql 的索引结构说下(说了 B+树,B+树可以对叶子结点顺序查找,因为叶子结点存放了数据结点且有序)
主键索引和普通索引的区别(主键索引的叶子结点存放了整行记录,普通索引的叶子结点存放了主键 ID,查询的时候需要做一次回表查询)一定要回表查询么?(不一定,当查询的字段刚好是索引的字段或者索引的一部分,就可以不用回表,这也是索引覆盖的原理)
你们系统目前的瓶颈在哪里?
你打算怎么优化?简要说下你的优化思路
有什么想问我么?
四面
介绍下自己
为什么要做逆向?
怎么理解微服务?
服务治理怎么实现的?(说了限流、压测、监控等模块的实现)
这个不是中间件做的事么,为什么你们部门做?(当时没有单独的中间件团队,微服务刚搞不久,需要进行监控和性能优化)
说说 Spring 的生命周期吧
说说 GC 的过程(说了 young gc 和 full gc 的触发条件和回收过程以及对象创建的过程)
CMS GC 有什么问题?(并发清除算法,浮动垃圾,短暂停顿)
怎么避免产生浮动垃圾?(记得有个 VM 参数设置可以让扫描新生代之前进行一次 young gc,但是因为 gc 是虚拟机自动调度的,所以不保证一定执行。但是还有参数可以让虚拟机强制执行一次 young gc)
强制 young gc 会有什么问题?(STW 停顿时间变长)
知道 G1 么?(了解一点 )
回收过程是怎么样的?(young gc、并发阶段、混合阶段、full gc,说了 Remember Set)
你提到的 Remember Set 底层是怎么实现的?
有什么想问的么?
五面
五面是 HRBP 面的,和我提前预约了时间,主要聊了之前在蚂蚁的实习经历、部门在做的事情、职业发展、福利待遇等。阿里面试官确实是具有一票否决权的,很看重你的价值观是否 match,一般都比较喜欢皮实的候选人。HR 面一定要诚实,不要说谎,只要你说谎 HR 都会去证实,直接 cut 了。
之前蚂蚁实习三个月怎么不留下来?
实习的时候主管是谁?
实习做了哪些事情?(尼玛这种也问?)
你对技术怎么看?平时使用什么技术栈?(阿里 HR 真的是既当爹又当妈,)
最近有在研究什么东西么
你对 SRE 怎么看
对待遇有什么预期么
最后 HR 还对我说目前稳定性保障部挺缺人的,希望我尽快回复。
小结
蚂蚁面试比较重视基础,所以 Java 那些基本功一定要扎实。蚂蚁的工作环境还是挺赞的,因为我面的是稳定性保障部门,还有许多单独的小组,什么三年 1 班,很有青春的感觉。面试官基本水平都比较高,基本都 P7 以上,除了基础还问了不少架构设计方面的问题,收获还是挺大的。
==========================================================================
面试前
面完蚂蚁后,早就听闻拼多多这个独角兽,决定也去面一把。首先我在脉脉找了一个拼多多的 HR,加了微信聊了下,发了简历便开始我的拼多多面试之旅。这里要非常感谢拼多多 HR 小姐姐,从面试内推到 offer 确认一直都在帮我,人真的很 nice。
一面
为啥蚂蚁只待了三个月?没转正?(转正了,解释了一通。。。)
Java 中的 HashMap、TreeMap 解释下?(TreeMap 红黑树,有序,HashMap 无序,数组+链表)
TreeMap 查询写入的时间复杂度多少?(O(logN))
HashMap 多线程有什么问题?(线程安全,死锁)怎么解决?( jdk1.8 用了 synchronize + CAS,扩容的时候通过 CAS 检查是否有修改,是则重试)重试会有什么问题么?(CAS(Compare And Swap)是比较和交换,不会导致线程阻塞,但是因为重试是通过自旋实现的,所以仍然会占用 CPU 时间,还有 ABA 的问题)怎么解决?(超时,限定自旋的次数,ABA 可以通过原理变量 AtomicStampedReference 解决,原理利用版本号进行比较)超过重试次数如果仍然失败怎么办?(synchronize 互斥锁)
CAS 和 synchronize 有什么区别?都用 synchronize 不行么?(CAS 是乐观锁,不需要阻塞,硬件级别实现的原子性;synchronize 会阻塞,JVM 级别实现的原子性。使用场景不同,线程冲突严重时 CAS 会造成 CPU 压力过大,导致吞吐量下降,synchronize 的原理是先自旋然后阻塞,线程冲突严重仍然有较高的吞吐量,因为线程都被阻塞了,不会占用 CPU )
如果要保证线程安全怎么办?(ConcurrentHashMap)
ConcurrentHashMap 怎么实现线程安全的?(分段锁)
get 需要加锁么,为什么?(不用,volatile 关键字)
volatile 的作用是什么?(保证内存可见性)
底层怎么实现的?(说了主内存和工作内存,读写内存屏障,happen-before,并在纸上画了线程交互图)
在多核 CPU 下,可见性怎么保证?(思考了一会,总线嗅探技术)
聊项目,系统之间是怎么交互的?
系统并发多少,怎么优化?
给我一张纸,画了一个九方格,都填了数字,给一个 MN 矩阵,从 1 开始逆时针打印这 MN 个数,要求时间复杂度尽可能低(内心 OS:之前貌似碰到过这题,最优解是怎么实现来着)思考中。。。
可以先说下你的思路(想起来了,说了什么时候要变换方向的条件,向右、向下、向左、向上,依此循环)
有什么想问我的?
二面
自我介绍下
手上还有其他 offer 么?(拿了蚂蚁的 offer)
部门组织结构是怎样的?(这轮不是技术面么,不过还是老老实实说了)
系统有哪些模块,每个模块用了哪些技术,数据怎么流转的?(面试官有点秃顶,一看级别就很高)给了我一张纸,我在上面简单画了下系统之间的流转情况
链路追踪的信息是怎么传递的?(RpcContext 的 attachment,说了 Span 的结构:parentSpanId + curSpanId)
SpanId 怎么保证唯一性?(UUID,说了下内部的定制改动)
RpcContext 是在什么维度传递的?(线程)
Dubbo 的远程调用怎么实现的?(讲了读取配置、拼装 url、创建 Invoker、服务导出、服务注册以及消费者通过动态代理、filter、获取 Invoker 列表、负载均衡等过程(哗啦啦讲了 10 多分钟),我可以喝口水么)
Spring 的单例是怎么实现的?(单例注册表)
为什么要单独实现一个服务治理框架?(说了下内部刚搞微服务不久,主要对服务进行一些监控和性能优化)
谁主导的?内部还在使用么?
逆向有想过怎么做成通用么?
有什么想问的么?
三面
二面老大面完后就直接 HR 面了,主要问了些职业发展、是否有其他 offer、以及入职意向等问题,顺便说了下公司的福利待遇等,都比较常规啦。不过要说的是手上有其他 offer 或者大厂经历会有一定加分。
小结
拼多多的面试流程就简单许多,毕竟是一个成立三年多的公司。面试难度中规中矩,只要基础扎实应该不是问题。但不得不说工作强度很大,开始面试前 HR 就提前和我确认能否接受这样强度的工作,想来的老铁还是要做好准备
===========================================================================
面试前
头条的面试是三家里最专业的,每次面试前有专门的 HR 和你约时间,确定 OK 后再进行面试。每次都是通过视频面试,因为都是之前都是电话面或现场面,所以视频面试还是有点不自然。也有人觉得视频面试体验很赞,当然萝卜青菜各有所爱。最坑的二面的时候对方面试官的网络老是掉线,最后很冤枉的挂了(当然有一些点答得不好也是原因之一)。所以还是有点遗憾的。
一面
先自我介绍下
聊项目,逆向系统是什么意思
聊项目,逆向系统用了哪些技术
线程池的线程数怎么确定?
如果是 IO 操作为主怎么确定?
如果计算型操作又怎么确定?
Redis 熟悉么,了解哪些数据结构?(说了 zset) zset 底层怎么实现的?(跳表)
跳表的查询过程是怎么
样的,查询和插入的时间复杂度?(说了先从第一层查找,不满足就下沉到第二层找,因为每一层都是有序的,写入和插入的时间复杂度都是 O(logN))
红黑树了解么,时间复杂度?(说了是 N 叉平衡树,O(logN))
既然两个数据结构时间复杂度都是 O(logN),zset 为什么不用红黑树(跳表实现简单,踩坑成本低,红黑树每次插入都要通过旋转以维持平衡,实现复杂)
点了点头,说下 Dubbo 的原理?(说了服务注册与发布以及消费者调用的过程)踩过什么坑没有?(说了 dubbo 异常处理的和打印 accesslog 的问题)
CAS 了解么?(说了 CAS 的实现)还了解其他同步机制么?(说了 synchronize 以及两者的区别,一个乐观锁,一个悲观锁)
那我们做一道题吧,数组 A,2*n 个元素,n 个奇数、n 个偶数,设计一个算法,使得数组奇数下标位置放置的都是奇数,偶数下标位置放置的都是偶数
先说下你的思路(从 0 下标开始遍历,如果是奇数下标判断该元素是否奇数,是则跳过,否则从该位置寻找下一个奇数)
下一个奇数?怎么找?(有点懵逼,思考中。。)
有思路么?(仍然是先遍历一次数组,并对下标进行判断,如果下标属性和该位置元素不匹配从当前下标的下一个遍历数组元素,然后替换)
你这样时间复杂度有点高,如果要求 O(N)要怎么做(思考一会,答道“定义两个指针,分别从下标 0 和 1 开始遍历,遇见奇数位是是偶数和偶数位是奇数就停下,交换内容”)
时间差不多了,先到这吧。你有什么想问我的?
二面
面试官和蔼很多,你先介绍下自己吧
你对服务治理怎么理解的?
项目中的限流怎么实现的?(Guava ratelimiter,令牌桶算法)
具体怎么实现的?(要点是固定速率且令牌数有限)
如果突然很多线程同时请求令牌,有什么问题?(导致很多请求积压,线程阻塞)
怎么解决呢?(可以把积压的请求放到消息队列,然后异步处理)
评论