二面23号下午(40min):
1.自我介绍
2.hadoop和spark的区别
3.spark怎么实现流式计算的
4.了解flink嘛(不了解)
5.hive和hdfs的关系
6.hive的计算引擎有哪些
7.介绍一下shuffle
8.了解redis嘛(只知道是键值数据库)
9.联合索引的好处
10.查询条件为c = xxx,b = xxx and c = xxx,a = xxx and b = xxx and c = xxx时,怎么建立联合索引
11.代码题一:两个比较容易的SQL语句,但我不知道怎么从datatime类型中取出year、month、day等信息
12.代码题二:给你一个random()函数,它返回0的概率是P,返回1的概率是1-P。让你构造一个s_random()函数使返回0和1的概率相等。
这次面试很快就结束了,并且刚结束5min就告知通过了,让选择三面的时间,希望可以入职字节鸭。