滴滴 (数据开发)-一面
1. Spark的shuffle和MR的shuffle的区别
2. 数据倾斜的处理方法
3. 数据倾斜的定位方法,(sparkwebUI里看stage的执行时间)
4. spark语句的解析方法
5. spark的命令执行过程
6. sql:最大连续登陆用户个数
滴滴(数据开发)-二面
1. 数仓的星型模型雪花模型
2. 数仓的分层架构
3. 场景题,库存快照表的需求如何做,要用到底层哪些原始表
4. 拉链表的写法,更新方法
5. 场景题:现在有一个需求要统计库存的报损率,需要怎么去设计
6. 底层全量表的个数
7. sql:用户留存,三日留存,七日留存
流程体验:断档最差,没有之一,因为是一天连续面,所以可以理解规划上可能出问题。(仍然逆天)一面二面面试官一个迟到十分钟一个迟到二十分钟,一面面试官道歉了然后态度也比较好,二面面试官则一烂到底,然后非要问我那个库存的场景,我说我没接触过不太了解它的业务场景,就让我先想一想,我随便答了几个入库出库盘算(根据常识说的),然后他也不跟我讨论,沉默之后直接下一个话题,我是真的无语了。。。