本人24届某211大数据专业,字节也是本人的第一个面试。
首先是一个自我介绍,
然后问了项目的东西,
比如用的是维度建模嘛,用了什么事实表,用了什么业务,事实表有哪几种分类
项目中的数据域是怎么划分的。
然后问了MapReduce的执行流程,问了一个Map阶段的数据切分函数(没答上来),又问了MapReduce可以不要map嘛。
接着问了spark,问了spark和Hadoop有什么区别。
hive问了窗口函数的使用,外表表和内部表有什么区别。
然后问了你在项目中遇到过什么难点,我说我遇到过spark因为内存不足执行失败,又问我怎么解决的,我就说把yarn调大,然后又问我有没有考虑过其他的比如sql优化,我说没有。
最后就是做了两个sql题
截图了第一张。第二题是求参赛者的连胜天数。因为当时没怎么练sql所以第一天就卡住了,group by 还出现语法错误,最后两个题都没做出来。然后就凉凉了。
不过还有一点我发现原来字节的面试官也晓得尚硅谷哪个电商项目哈哈哈,因为最后面试官问我最近在学什么技术嘛,我说我在复习数仓,他就问是不是尚硅谷哪个,我说是的哈哈哈哈