9.24
面试时间:30min
自我介绍
实习介绍
数仓分层?
ODS层怎么分区的?多久清理一次?
DWD层做了那些工作?
数据清洗怎么搞的?清洗掉了那些字段?为啥要清洗这些?后面不会用吗?如果后面的指标需要用怎么办?
怎么脱敏的?UDF怎么用?除了UDF还有什么方式?
维度退化是怎么做的?为什么要这样做?
宽表都在那一层?
开窗函数用过那些?rank,dense_rank区别?
lead,lag区别?
内部表和外部表区别?
MapReduce介绍一下?shuffle作用?
Hadoop组成?
2NN再介绍一下?
NameNode挂掉后怎么重启?
Spark了解多少?
Spark的缺点?
SQL题:口述分组topN,不用开窗函数能实现吗?
HR询问:
为啥想来杭州?
本科学校啥层次?
有其他offer了吗?为什么选择我们公司?
有学生干部经历吗?
反问:流程?
这次的面试官似乎对我实习的项目不太感兴趣,反而是怼着我自学的sgg数仓使劲问
10.4
面试时间:30min
面试官和HR在一起问,这次没自我介绍
讲一个你最近做的项目?
深挖项目细节,数仓主题?数据链路?讲一个具体的链路过程?指标体系?
一个场景,应该如何建模?
参加过的比赛,团队赛扮演的角色?
论文相关的问题。
HR常规询问