20221012银联数据面试(一面)
写在前面:约的早上10:10,10:11开始面试,大搞20分钟结束,稍微有点卡,整体体验不错~在这里记录下
面试流程
- 自我介绍
- SparkStreaming项目详说(说一半儿不让我说了,估计嫌烦)
- 问项目是不是事实项目,说不是,是练手的
- 问scala相关知识,问函数式编程优点,说了个简单,符合大数据的逻辑,没了,他问我还有没有?/捂脸,是真不知道了
- 问java,让讲java多态,巴拉巴拉一顿讲
- 问Hadoop组件,以及运行逻辑
- 问Hadoop调度器类型
- 问SparkStreaming和flink区别,简单讲了下运行原理,flink更快
- 问union和union all区别,这个忘了直接说不会,答案因该是一个有重复的一个没有重复的
- 问join类型,把四个一讲,然后full outer join带进项目讲了下
- 问spark运行过程会产生那些进程,分别是干啥的
- 问spark和mapreduce的区别,巴拉巴拉一顿说
- 问查看进程命令-->linux,说了top和ps加管道
- 问查看文件夹大小命令,说了du和df,然后后面参数不记得
- 问spark repartition,这个我不知道,直接说不知道了,说没接触过这个概念,只知道kafka的repartition
- 问mysql索引,说了B树和B+树,主要用于高效率取数(其实这里应该扩展开来讲下的,可惜了)
- 反问,结束
以上
持续更新状态,希望对后来者有所帮助
//20221024更新 收到性格测试
#银联数据##银联##中国银联#