说明一下我面试的岗位是数据研发
8月31号快手一面1小时:
面试官是个小姐姐,很和蔼!
1.自我介绍
2.问滴滴和字节实习主要做的工作?
3.介绍一下字节的大数据架构?
4.说一下你们部门数据仓库的建设?
5.和滴滴相比,你觉得差异在哪里?
6.在需求过程中有没有遇到什么难处理的数据问题?
7.就拿数据倾斜来说,你有几种处理方式
8.你是做离线还是实时的?
9.某个离线任务出现了问题,你会如何解决?处理的流程是什么?
10.你的实习经历都是数据研发,有没有想过其他岗位,你对你的未来发展,是什么打算?
11.你对快手和抖音公司未来的发展是如何看待的?
12.时间差不多了,我们来写题:sql题:求解每个app访问最多前5个用户的userid ,ac100
11.网吧的概率题,求两个人认识的情况?这个题条件很多,没记住,很难,不会,写了一点,说了一下思路
全程就像聊天,问题不难,其实都总结过,哈哈哈就像在背书,其实回答的问题也在引导面试官往我擅长的地方问,很愉快,后面没时间反问面试官了
没过3小时,收到2面通知
9月1号2面 70分钟
1.看了你的简历,你的专业偏向于管理优化,说说你为啥做数据研发?
2.自我介绍
3.介绍一下你在字节的数仓建设,以及你负责的工作?
4.说一下维度建模中的几种模型?你们那边用哪种模型较多,为什么?
5.说一下你对维度建模的理解?
6.雪花模型的优点是什么?
7.你们公司技术架构是什么?
8.你们的任务,是如何判断用hql跑还是sparksql跑?怎么评判执行的代价?
9.离线任务出现报错,你会如何去解决?
10.考察一下技术知识,你知道hadoop的二次排序吗?不知道
11.Hadoop和spark分别是适用于什么场景?
12.你刚才提到spark的优化?简单说一说
13.考察一下代码:给你x,y两个超出整型类型的超大整数相乘,如何实现?转换成字符串,想用我们笔算的方式实现,就写了个遍历字符串,相乘,写了一半,不会了,说了一下思路.
14.sql题:用户连续登陆的天数 ac100
15反问阶段
面试官全程都是有针对的问问题,业务问题都能瞎扯一下,但是需要回答的有条理,其他的执行代价的问题也不会,哈哈哈,最后反问阶段,面试官和我说了一大堆,说总共4面,优秀的人会加面,后面等hr安排