当前位置: 首页 > 面试经验 >

字节跳动大数据研发实习生-商业化技术凉经

优质
小牛编辑
130浏览
2023-03-28

字节跳动大数据研发实习生-商业化技术凉经

1. 自我介绍,项目介绍

2. 自我介绍的时候问我这些东西是自己学的还是学校讲的。 内心:在说什么。。。

3. 因为简历上第一个写的是使用爬虫进行数据挖掘,但是没用flume进行数据采集,所以就简单的说一下当时是把数据采集成csv或者data格式的文件,直接上传到的Hdfs,直接使用load path加载到hive当中。
    并且当时介绍了数据集的大小,以及介绍了可能会产生的问题,

4. 面试官开始提问的时候问的基本上都是关于数仓方向的,可能跟岗位方向有关系。

5. 数据仓库是什么?

6. 数据仓库的分层每层都是什么,并且每层的作用都说一下,数仓后两层架构用的不是很多,所以就说了一下前三层的基本作用,也简单介绍了一下后两层的概念。

7. Hive的主要作用是什么?Hive的order by和sort by了解吗说一下都是什么作用并且区别是什么。

8. 在第一个项目中是否遇到过数据倾斜问题,是,遇到的数据倾斜的种类主要是什么,并且是如何解决数据倾斜的。

9. 当时最不了解的一个问题就是hive是如何把sql转化成mapreduce程序的,当时没记下来是怎么转化的。

就从hive的整体架构从sql从hive中是怎么执行的,并且说了一下mapreduce的执行流程来解释是怎么转化的,(本身菜狗)

10. Flume的整体架构,当时说了source,channel,还有sink,并且说了一下常用的种类。

11. Kafka中的ack应答机制了解吗,当时对于ack机制大致的说了一下,并且用http中的ack机制做了一下比较相同点是什么。

12. 说一下kafka的整体架构,当时从broker和producer说的,感觉kafka问的不是那么多。

13. 面试官:我看你现在有在学spark和flink,你认为flink和spark的区别是什么呢?因为当时刚刚接触,就从数据处理差距方面来说的,还有离线和实时两个方面来说的。

14. Sql中什么是事务?事务隔离级别是为了解决什么问题?事务都具有哪些特性?

15. 之后就是Java部分,HashMap线程安不安全?为什么不安全?HashMap的底层结构是什么构成的,还有HashMap是如何进行扩容的(拉链法)(这个是真的没有看过长知识了hhh)。

16. 多态的概念?当时从重载的方面简单叙述了一下,好久没看有点生疏了嘿嘿。

17. 快速排序的思想是什么?还有归并排序和冒泡排序?

18. 最后两道code链表排序和三角形最大周长
19.hive中内部表和外部表的区别,并且了解到了部门中主要使用的还是内部表多一点。

19. 反问:当时还问了这次面试结果会影响到我下次投字节跳动吗,太菜了实在是。

并且问了一下部门技术栈,spark,flink,kafka,主要还是flink,商业化分析部门,hive和sql掌握的要求稍微多一点。

最后想说字节的面试官真的好多了,全程都很温柔而且笑容也贼美滴,字节跳动面了一个小时,最后会议室到期了才结束hhh,字节的面试官真的炒鸡好,能面一次字节跳动也值得了hhh,虽然没回复但是面试感觉以及深度都不错滴。

当时面试时主要通过描述数仓来大体模拟公司业务,虽然还没系统学习完整的类似电商平台的数据仓库。

#实习##字节跳动#
 类似资料: