一面
数据同步怎么做的
事实表、维度表怎么设计
数据完整性、唯一性怎么保证
数据怎么分区,如果增量同步,需要历史数据合并分区慢怎么解决
数仓如何进行组件选型,理由
数仓建设过程中有哪些难点
atlas如何获取数据血缘
拉链表怎么设计
你觉得拉链表常用吗,为什么不用
那你为什么要设计拉链表
sql题 分组topn
row_number rank dense_rank区别
看两个sql,差异在哪,哪个好,为什么
高耗时任务优化思路
尽可能优化后数据还是倾斜怎么办
mapreduce原理
mapreduce几次排序,为什么要排序
#面经##快手#太菜了,估计又凉了