面的是团子的金融部门,挺感兴趣的,记录一下二面问题
1.说说你做的两个项目(一个离线数仓一个flink)
2.你挑一个详细说说吧(面试官笑,当时感觉有点不妙了,,,觉得面试官啥都能问,我说了flink)
3.说说watermark机制
4.说说checkpoint机制
5.说说exactly-once是怎么实现的
6.了解反压吗(了解)
7.你觉得hadoop和spark差别在哪
8.你对实时更感兴趣还是离线更感兴趣
9.接着拷打离线数仓内容,你了解数仓分层吗?为什么要分层?
10.你说dwd层有周期快照事实表和累积快照事实表,这两个表有什么用?
11.为什么要同时设计这两个表呢?(面试官应该是觉得累积快照事实表会有数据冗余,其实只留周期快照事实表就行了)
12.如果要使用用户的明细数据,应该去哪个层取?
。。。。。。(省略一些问题,回想不起来了)
13.做一道sql题,是求每月每个城市平均每个配送员送单量(面试官自己出的,第一次写完是错的,面试官给了一些思路引导我再写一次,写完以后才发现这道题还挺简单的,但写的磕磕碰碰,不知道面试官怎么想了)
总的来说,面试官问的很具体,都是从项目出发问一些实际业务中的问题,感觉很有挑战。另外面试官也很nice,会很耐心的引导我思考问题以及解释场景
许愿二面过~