处女面,很紧张
1. 问项目
2. 项目中为什么使用kafka作为缓冲队列。
3. mapreduce原理。
4. 如果mapreduce发生数据倾斜该如何解决。
5. 解释一下列式存储、列式存储的文件格式。
6. 星型模型、雪花模型、星座模型的区别和应用场景。
7. 拉链表是什么、一般解决什么问题。
8. 什么是指标体系、如何明确指标体系。
9. zookeeper、datax等(项目上写的组件)这些组件的原理熟悉吗?
10. Python的运用水平。
11. 能否编写shell脚本完成日常数据导入?
反问xxx