1、自我介绍
2、数据仓库为什么要分层,目的是什么
3、DWS层和DWT层是怎样划分的
4、PV和UV分别是什么
5、数据仓库建模的两种形式
6、范式建模中的第三范式的原则
7、维度建模中最常见的建模形式是什么区别是什么
8、如何评判数仓的优劣性
9、MR流程是写的MR程序,还是通过hql
10、用户留存率的计算公式
11、HDFS的写流程
12、MR的底层原理
13、MR是分为哪几个阶段,每个阶段的主要任务是什么
14、YARN的工作原理
15、spark的核心是什么
16、 RDD的五大属性
17、数据倾斜的产生原因,在哪个阶段产生
18、数据倾斜的解决办法
19、mysql的索引机制,在什么场景用,为什么要用索引,什么样的字段可以用索引
20、场景题,A表三条数据,B表五条数据,如果用left join,查询结果的范围是什么
21、15分钟内手撕三道SQL
22、未来的职业规划
23、对公司的期望
#2023秋招# #面经#