一面 40min 0919
不记得问了什么,大致好像是围绕目前的实习展开。
二面 40min 0920
努力回忆一下,问了一些八股
1. 为什么划分宽窄依赖?
2. Checkpoint和Persist?
3. MR过程?
4. 为什么Spark比Hive快?(这其实不合理,一个计算引擎和一个数仓工具,没法比较,面试官应该想问的是Spark和Hive的默认MR引擎吧,然后按照这个方向回答的)
5. 为什么要分层?
6. 还有其他的一些八股
7. 围绕实习项目展开询问
三面 40min 0922
也不记得太多了,主要写一下没回答上来的几个问题
1. MySQL的事务是怎么实现的?
2. 分布式MySQL是怎么保证事务的?(可能是想问两阶段提交,但当时有点紧张,面试官气场很强,忘记说了)
3. 问:循环链表,怎么探测?
答:快慢指针
问:只给一个指针呢?
答:一个指针,需要来一个HashSet
问:只给O(1)的空间呢?
答:.... (没回答上,后来和@前端练习生z 讨论后可能是需要改变链表状态的,比如把指针逆置,或者改变val值成一个特定值等等)
4. 讲一下自己熟悉的组件(讲了Spark)
5. Spark有哪几种部署模式?
6. Yarn有哪些任务调度算法(那三个,嘴贱自己展开了,但是忘记Fair的具体算法...)
一些其他的还记得的八股
7. 为什么要分层?(又问了一次)
8. 联通和抖音最大的区别在哪里?
9. 还有一些八股
10. 围绕实习项目展开询问
#数据仓库与数据分析实习##秋招##秋招面经##2023秋招#