2022/07/18 一面 20min
- 自我介绍
- 为什么想来武汉发展
- 了解长江存储吗
- 大数据国赛流程
- 难点
- 机器学习选用的模型 随机森林和SVM对比了吗
- 特征工程怎么做?
- 随机森林交叉熵、基尼系数(没说出来。。。)
- HDFS读写
- MapReduce
- Kafka是什么?特点?
- 实习做什么业务?
Flink介绍
反问:业务?
2022/07/20 一面通过,收到测评邮件
-------------------------------------------------------
2022/08/11 二面 30min
两个面试官其中一个是个老外 说中文真的太抽象了(好多问题都没听清)
- 自我介绍
- 大数据框架哪个熟
- hive 和spark关系
- 场景题:sensor传感器实时传数据到hive你会怎么做
- hive数据倾斜怎么做
- partition关键字做什么
- 为什么要分区
- 代码找错 SQL和python
- 机器学习了解吗
- 线性回归和逻辑回归区别
- 大数据国赛逻辑回归怎么用的
- 特征工程
- 用什么判断二分类准确与否
- 统计学会吗
- 正态分布参数
时间问了30min 下一个人进会议间就让我退出去了 没来得及反问
#长江存储##大数据开发#