一面
项目深挖
数仓分几层,每一层的作用
事实表如何设计
维度表如何设计
数据域如何划分
业务总线矩阵的概念
如何设计完整的指标
开发中和上线后数据质量如何保证
如何设计调度,依据是什么
hive数据倾斜解决办法
hivesql常见优化手段
什么是spark宽窄依赖,起到什么作用
sql题:用户连续登录游戏的最大天数,允许间隔一天
反问
做什么业务 教培业务中的线下面授分析
网络问题迟到了一会,面试官很不爽,没想到秒约二面
二面
感觉两面问的都很相似
项目深挖
维度建模理论介绍
范式建模和维度建模的特点和区别
为什么数仓不用范式建模
缓慢变化维的解决办法
数据质量的几个性质,分别如何保障
hive表三种格式text,orc,parquet的区别
hive数据倾斜解决办法
如果参数调优无法解决倾斜,还有别的办法吗
sql题,又是连续登录,这回要求至少2种不同的解法
反问 数据来源有哪些 有没有转正机会
流程很快,oc
#面经##好未来#