当前位置: 首页 > 面试经验 >

快手数据研发一面(大数据、数仓、数开)

优质
小牛编辑
65浏览
2024-05-09

快手数据研发一面(大数据、数仓、数开)

项目为sgg经典离线数仓
1. 自我介绍
2. 项目介绍(难点、亮点)
3. 根据难点亮点提问
4. 数据域是什么,如何划分数据域,为什么这样划分数据域
5. DIM层维度表的设计原则
6. DWD层事实表设计要点
7. mapreduce shuffle流程
8. maptask和reduce task 与哪些因素有关
9. 数据热点(数据倾斜)在哪些场景下出现,如何解决
10. spark是为了解决mapreduce什么问题设计的
11. 手撕sql ,用户关注表有user_id、user_follower_id,求相互关注的用户对
12. 谓词下推是什么
13. 连接条件写在on里和where里有什么区别
14. count(1)和 count(*)的区别
15. count(1)如果其中有Null值,和count(*)一样吗,为什么
16. mapreduce和spark处理distinct去重操作的执行计划以及原理
17. sparksql调优的方法依赖日志诊断,具体不同情况如何根据日志去调优
18. 反问
5.10 更新 流程已结束
双非属鼠又一次倒下了
 类似资料: