自我介绍
面试官介绍
对大数据的了解,自己那块比较熟悉?
Java基本数据类型,包装类,为什么会有包装类型?
重载和重写?
什么是反射?
什么是泛型,有什么用?泛型的使用方式有哪几种?
集合类型介绍?底层都是怎么实现的?
线程和进程对比?
对Hive的理解?
Hive如何删除一条记录?
开窗函数用过那些?lead,lag区别?
Spark知道有几部分模块吗?用过那些?
对Spark做过那些优化?
给一道真实场景题,口述一下应该用那些RDD算子解决?
kafka了解多少?
offset有什么作用?
Kafka挂掉的场景题?
OLAP知道几个?
Clickhouse原理?
Doris与Clickhouse区别?
Flink了解吗?
Flink 中的Watermark机制?
Flink的背压机制 ?
One-Data理论了解吗?
反问:部门业务?离线和实时计算比例?知乎的大数据体系?数仓和推荐系统的关系?
面试官比较健谈,总共面试了40分钟,我感觉至少有15分钟是面试官在主动介绍和给我的回答点评。后面了解知乎这边基本想招的是实时数仓,基本比较重视Flink。今天去官网看状态,凉凉。