岗位:数据开发
体验还不错,面试过程偏向聊天,会问一些新技术,从基础的框架为起点延申出一些问题,面试官也很友好,有些问题答不上来也说没关系
问的相对基础,但但范围较广
(忘记录屏以下为回忆,面试时长1h
[蔚来数开一面]
自我介绍
实习介绍(因为前一份实习和数开相关性不是很大,只是写过sql就简单带过了没深挖
kafka相关:
kafka的结构
优点,和其他消息队列相比优势在哪
数仓项目(自己做的简单的电商数仓):
问数据流的过程,用了哪些组件
flume:
了解flume吗(不了解就没继续问了
hadoop:
mapreduce的流程
maptask的数量怎么定
小文件过多的影响,怎么处理
spark:
spark简单介绍
mr和spark的区别,
spark宽窄依赖
数仓理论:
数仓分层的理论,各层的作用,维度建模的概念
一道sql:新用户首日留存率
一道算法:给一个数组,返回和为一个target的两个数的下标(剑指的简单题