1、自我介绍
2、为什么要去北京
3、MR的原理
4、为什么环形缓冲区到80%之后才反向溢写
5、SQL中哪些函数走MR,max走不走
6、select a,count(distinct b) from table group by a,MR的流程
7、SQL优化,如果给你两张表,用户视频表和用户粉丝表,怎么处理数据倾斜
8、SQL题:每个用户都有5门成绩,总计6列。请生成两列,其中1列是用户ID,另外一列是该用户最高的三门成绩
9、SQL题:p_date uid city 统计每个用户上周定位最多的城市统,如果定位天数相同的城市有多个,在取定位最新的城市
10、反问
感觉答的不是很好,写SQL的时候先给面试官说了思路,然后面试官看了看说没问题。面试完之后想起来自己写的时候写出语法错误了,本来以为凉了,结果一个小时之后约了周四三面
#数据人的面试交流地##快手[话题]#