1.自我介绍
2.对公司有没有了解
3.inner join的底层实现,有哪些算法
4.两个数组,数组的大小都在数千万级以上,但是值域是在一千万以内,找到两个数组相同的元素(说了bitmap)
换了部门负责人来面试
5.有了解过数仓整体的架构吗(面试官说现在是存算分离,实时和离线一体)
6.有写过UDF吗,当时的场景是什么样的
7.假设现在用的是yarn,pyspark从提交文件到让代码分布到各个节点上的过程(面试官说主要关注driver中的代码和数据怎么和java线程交互)
8.为什么从大厂离职
当场通过