腾讯pcg:
10.8一面:面了大概1个小时左右
1、先自我介绍,然后聊了下实习经历
2、你们公司表的血缘关系是怎么做的?
3、关于Spark提优,你都做了哪方面的调优
4、如果是两个大表join,应该怎么做?
5、broadcast为什么会效率高?
6、讲一下数仓建模是怎么做的?
7、你们项目数据域是如何划分的?
8、介绍下同步和异步?
9、介绍下线程和进程的区别?
10、线程的开销为什么比进程小
11、它们各自适用于什么场景
最后两道手撕,一道算法:求一个字符串中最大的无重复字串的长度。一道sql:求10月每天1、2、3、4、5、6、7的用户留存率
10.11二面:面了大概1个小时
1、自我介绍,深挖实习
2、做了哪些调优工作,如何调优的
3、公司业务场景题出了两个。我给了几种不同的解法,各有什么优缺点?
4、数仓建模的整体流程
5、新生代和老年代之前怎么转换?
6、什么样的对象会进入老年代?
7、常见的垃圾回收器,讲一下CMS和G1垃圾回收的过程
8、介绍小flink的savepoint和checkpoint的过程
9、chenkpoint保存的具体是哪些数据
10、手撕leetcode困难题
10.14 hr面
10分钟,主要了解意向,目前已有的offer等
10.22 已oc