1.自我介绍
2.数据仓库和数据库的区别
3.数仓的架构
4.分层
5.维度建模步骤
6.缓慢变化维
7.如何处理缓慢变化维(拉链表的设计)
8.通过拉链表如何获取某一天的所有用户状态
9.采用什么方式做数据的采集
10.数据哪来的
11.数仓最终的可视化怎么做的
12.OLAP引擎
13.如何评判数仓建模之后模型的优劣
14.用户分层的几种方式(交易链路,漏斗转换)
15.描述一个实时处理场景,整体的架构设计,从对接数据源到数据目的地
16.实时处理的一个小例子,截至今天早上8点的指标与截至昨天早上八点的指标对比,如何获取两个指标
17.当天截至八点的数据聚合应该在哪里做
18.sparkSQL和hiveSQL的区别
19.sql题,统计最近购买时间在去年12月的用户数量
整体面试过程比较轻松,面试官确实如网传一样,特别温柔