1h10 min
面试官是个大佬,全程面试偏场景题
八股:数仓建模,分层,每层作用,数据倾斜(group by,join)很细,小文件
场景题:
快手在某一时刻某主播开播时流量巨大,然后同一时间段还有多个主播开播
有一些些主播可能粉丝少,但因为在搞活动,把在线列表和主播表join时会发生数据倾斜,这怎么解决
雪花模型用过吗?(用过)讲一个使用雪花模型的场景(多值维度?)面试官说不对。然后只能说没用过
上层埋点时如果出现时间不一致怎么解决(什么玩意,不会)
离线数仓的实时性了解吗?(没太听懂面试官的点)但还是答了自己理解
为什么实时数仓现在还是在企业里无法完全替代离线数仓?
FLINK的缺点知道吗(不太了解)
手撕3个sql:比较简单,经典连续登录,留存率,left join 问题,全搞出来了
反问:面试表现:基础尚可,但缺少实际的企业项目经验。(寄了)
面试官主要做的工作:管整个大数据组的,什么项目都做一点
鉴定为寄