面试时间30min,无手撕:
1.首先做了自我介绍和项目介绍
2.如何开发的数仓项目,照着复制粘贴还是自主开发
3.单一全量表,还是有增量表
4.如何进行的维度建模
5.项目中dws层的作用
6.如何做的数据同步,数据传输
7.业务数据库和数仓ods层有什么不一致
8.对于一直增加,并且一直变化的订单,应该使用全量表还是增量表
9.为什么使用增量表
10.要查询某一个订单的详情,但是不知道日期,如何确定在哪一个增量表里
11.具体介绍一下拉链表
12.窗口函数介绍,除了partition by+order by还可以用什么
13.order by存在什么问题
14.hive sql和spark sql什么用的多
15.两者的区别,说一点就行
16.项目hive的存储格式用的什么
17.介绍一下orc的优点
18.在项目中做的优化
19.java的集合类型,是否是线程安全的(为一道非项目提问)
整体比较简单,都是问的项目内容,八股问的挺少的。
#数据人的面试交流地#