自我介绍
数仓分层
sql 最近五天的下单用户
left join左边三个数据,右边4个数据,最多会有几行数据
数据倾斜的优化方案,举几个例子
场景问题,如果例如下单转化率,肯定不超过1,那么如果这个指标会产生问题,那么应该监控哪些指标
在工作中,如何保证一个新任务,按时按质按量交付
反问
二面
自我介绍
数据倾斜
随便一个shuffle过程
shuffle怎么优化
为什么sparkshuffle比mr的好
http介绍一下
为什么用hive sql
底层会对其做什么优化
谓词下推是什么
hbase布隆过滤器
读写流程
分裂过程
tcp三次四次过程
tcp udp区别
java static 和final
反射,泛型
数组,链表
排序介绍一下,时间复杂度
反问