1、 是找大数据还是算法?
2、 对大数据领域的了解?
3、 从0-1建设数仓,你怎么做?
4、 数仓建设规范,依据?
5、 没想一块去,他想问建模思想之类的。维度、范式
6、 会哪些技术栈?
7、 Hadoop讲讲吧?
8、 为什么要有Hive,Hive作用?
9、 详细讲讲MR?
10、 数据倾斜发生的位置?
11、 Combiner了解吗?
12、 什么情况下不能用Combiner?
13、 Sum、Count、Count(distinct)哪些能用、哪些不能用Combiner?
14、 理由呢?
15、 MR中几次排序?
16、 开窗函数用过哪些?
17、 row_number()在MR怎么发生的?
18、 Spark和MR都计算超过内存的数据,谁更快?
19、 掌握的还不错。
#数据研发工程师##大数据面试##数据人的面试交流地#