1.自我介绍
2.jvm的gc全流程,为什么要分这么多区,标记整理等算法对于gc的优缺点,遇到过哪些gc的实际例子,怎么定位这样的问题
3.同一个进程中有三个线程,一个线程发生了内存溢出,另外两个会怎么样,为什么
4.线程共享数据怎么实现的,一致性怎么保证
5.手撕:判断完全二叉树,反转链表
6.sql:窗口函数
7.hdfs架构,读写数据流程,datanode在写数据的时候挂了怎么办
8.小文件问题危害和解决
9.数据倾斜描述和解法,实际的数据倾斜例子
10.项目数据量级有多大
11.表里面存什么数据,描述最细粒度
12.你觉得构建数仓最重要的一点是什么
13.全链路如何保证数据准确性、数据质量
14.介绍实习,实习中最困难的问题,困难是和小组成员一起解决的吗
15.小组成员构成
16.数据是怎么给后端提供接口的
前面java和手撕部分完全都在扯淡,后续回答的还算OK,许愿许愿