一面:
全程围绕简历展开问
1、自我介绍
2、聊聊印象最深刻的一次竞赛经历 (简历写了)
针对这个竞赛内容抠细节
3、问实习经历中做的事情
挑了其中几个细问
这个答了好久,从事情的背景,到思考链路
4、一道算法题
一个数组先升序再降序,求最大值
5、hadoop数据的存储格式
6、spark里job、stage、task的概念
7、问flink、hudi这个有没有经验
因为简历上写了,回答说学习的时候有写过,flink感觉还是和spark一样,主要还是写算子数据处理逻辑,就没多问
8、反问
我反问了4个问题
(1)、公司的离线和实时的架构是什么
(2)、工作中是否有用到指标管理,是生产侧还是应用侧
(3)、公司是如何去支持业务方灵活的数据分析需求和固定的看板需求的
(4)、每次必问,我在此次面试中表现不足的地方
二面:
深挖写的项目(巨长)
hadoop的读过程
hadoop高可用
edits日志相关
聊聊hudi的理解
聊聊olap引擎的理解(这我真不会)
反问