今天面了字节大数据开发的三面,记录一下:
面试官先自我介绍,然后开始问专业知识。
1.你了解实时领域和离线领域的哪些技术?
2.mapreduce和spark作为计算引擎的差异
3.spark的rdd是什么
4.如何理解rdd中弹性的概念
5.spark有哪些调优方法
6.spark中的join操作有哪些
7.数仓建模方法有哪些
7.介绍一下flink的双流join,以及双流join可能会遇到哪些问题
8.反压机制了解吗
9.为什么流式计算中,恰好一次,最多一次,最少一次很重要
10.说一下watermark机制
11.讲一下spark的容错机制
12.OLAP机制了解哪些技术?clickhouse和doris了解吗?
13.介绍一下clickhouse的特点
14.这几年你做过的项目中,你觉得最复杂的项目是什么,介绍一下项目背景,你遇到最大的难题以及最终取得的效果。
15.你有什么快速学习一个技术栈的例子吗
16.评价一下你个人,有什么优缺点
没有编程题
总体答的还行,面试官也很nice,应该是个主管,许愿hr面~~