### 一面技术面
自我介绍
四道算法
前两题是sql,其中一个难点的就是求连续登录2天以上的用户
一道快排
一道求二叉树是否是对称二叉树,就是左右节点是对称的
问实习经历(问的很细)
工作中的难点
维度建模过程
聊到数据仓库工具箱这本书的内容,我都不会。。。
数据倾斜(我从原理,场景,解决方案三个角度回答的)
问到一些常用函数,UDF,UDAF,UDTF概念
hive的概述
hadoop,hive,spark他们的区别
collect_list,collect_set区别等等
spark的执行原理和过程概述一下
闻到了对hudi的理解(因为简历上写了,之前在同程学到了一点,hudi的意义
聊到了传统lambda架构,简述,流批的共同点(乱扯的)
kafka架构,负载均衡的实现(这个好像是百度面试的时候问的,我记忆有点紊乱了,两个面试离得很近)
flink的容错机制
还有好多不记得了,有点抽象
反问,ps.我个人反问都喜欢问平时真的想不明白的技术问题,不知道是好事还是坏事,另外还喜欢问的就是岗位负责的业务和部门职责,别的也不是很关心
###二面技术面
感觉面试官应该是做数分的
自我介绍
实习经历,问的很细
问SQL(sql真的很重要,因为工作就是写sql),简单题
表连接方式,区别
数据倾斜同一面
mapjoin的原理(这个要答全了,主要两点,一点是提前加载一个表进内存映射成哈希表,然后遍历另一张表进行匹配,另一点是因为全部发生在map端,没有reduce端参与自然就不会发生数据倾斜,因为没有shuffle嘛)
反问
### 三面hr面
在上一段实习中你觉得你学到什么(我老喜欢总结这些东西了,扯了一大堆)
谈谈你的性格优缺点
然后聊到了团队协作方面,因为我简历上竞赛和项目都是队长和负责人,所以问到了我对于队员间如果不合怎么办(
回答:我认为这个问题可以泛化一下,其实是在问团队成员之间发生了矛盾怎么办
我认为团队之间产生矛盾是不可避免的而且是不应该避免的,出现矛盾刻意的去淡化矛盾或者激化矛盾都是不可取的
有矛盾说明两者之间想法和认知有不一致的地方,那么就应该把各自的想法说清楚了,找到分歧点,抓住矛盾的本质,这样才能让整个团队得到提升,这样的团队才有成长的机会
)
然后还有一些常规问题,不记得了
反问
总结:字节的面试体验真的非常好,面试官都会淡化压力,让你不要紧张
#字节跳动面经##字节跳动大数据开发面经##字节跳动##字节跳动实习##字节跳动商业化#