当前位置: 首页 > 面试经验 >

字节跳动大数据开发转正实习面经(已OC)

优质
小牛编辑
157浏览
2023-04-19

字节跳动大数据开发转正实习面经(已OC)

字节整体给我的感觉是不怎么问八股,他们非常想听你的理解是什么,问的很多问题网上都没有答案,高度都很高。

一面(2023.3.22)

  1. 自我介绍
  2. 为什么选择从全栈开发转到大数据,为什么会对大数据感兴趣
  3. 有学习过大数据的一些技术栈或者项目实战么
  4. 狂问项目(国电的,问的极其极其细)
  5. 问了电商数仓项目(大概介绍了一下维度建模)
  6. DWS层都是什么类型的事实表(不知道怎么答,感觉问的很奇怪,就直接答了事务型事实表,其实我感觉它已经不是事实表了,因为到了DWS层,这个表已经和好多维度信息结合了起来,形成了一张表)
  7. 说一下三种事实表的区别
  8. 再次问DWS层是周期快照型还是事务型(我依旧坚持说是事务型,说实话真不知道咋答)
  9. 你知道无事实的事实表吗(我只看了尚硅谷的数仓建模知识,里面木有讲,所以没答上来,阿里大数据之路里面有说这个)
  10. 星型模型和雪花模型的各自的特点以及优缺点
  11. 数仓分层的价值在哪,为什么是分5层而不是3层或者2层
  12. Hive、SparkSQL哪个更熟悉一些(我说Hive更熟悉一些)
  13. Hive调优方法
  14. 追问:分桶表相关
  15. 大表join时,使用SMB join,一个分桶一个没分通,会有优化效果吗
  16. 一个表分了1000个桶,一个表分了2000个桶,有优化效果吗
  17. HiveSQL底层执行逻辑(SQL到MR的过程)
  18. MR的执行过程(MR任务的流程)
  19. hive.groupby.skewindata 参数调优的原理(分两个mrjob,分两次聚合)
  20. 追问:第一次聚合是用什么方法打散的
  21. HiveSQL题(需要生成日期)
  22. 经典反问

说实话很顶,当时面完感觉自己凉了,面试官贼有想法,他会根据你的回答不断地追问,直到你答不上来,我感觉整个的底都被他挖出来了,不过一面完俩小时后就约了二面。

二面忘记录音了(当时拿到美团offer了,就摆烂了),只能能回忆多少写多少了。

二面(2023.3.30)

  1. 问了项目
  2. 为什么选择大数据
  3. 说一下数据治理相关知识
  4. 数仓怎么分层
  5. 星型模型和雪花模型的区别
  6. 为什么数仓分层
  7. 介绍一下Flink
  8. Flink的状态有什么作用
  9. 你认为平台开发和数据开发的区别在哪里,哪个更有价值
  10. SQL题:每个部门的最高最低工资
  11. 整体很开放

4月4号HR面

4月5号OC,然后怕被美团拉黑,就拒绝了(很恐怖,HR清明节还在工作)。

 类似资料: