先是让我做自我介绍
1.hadoop是什么,hadoop的组成,以及每个组件的作用
2.hive跟hadoop是什么关系
3.hive内部表和外部表的区别
4.hive分区和分桶
5.hive中order by,clustered by以及sort by区别
6.hive中三个开窗排序函数的区别
7.hive开窗函数
8.hive的基础架构
9.hive优化
10.数仓分层以及分层的好处
11.hive数据倾斜解决方案
这个面试官逮住hive问,别的都没问,可能是岗位用hive比较多
反问环节:
岗位职责
公司的数仓是给自己业务做的还是给别人做的(公司自己的业务)
大数据部门的组成(面试官说武汉的大数据部门只有4个人,校招准备招3个)
#数据人的面试交流地#