陆续分享点面经 虽然大部分都被挂了hh 希望能帮到大家
3.15 一面
1.自我介绍
2.题外话 怎么看待数仓和算法的联系
3.项目
4.介绍一下对大数据技术生态的了解
5. 怎么理解spark和hive
6.hive的逻辑架构
7.MR的流程
8.整个MR有几次排序
9.spark的shuffle
10.怎么确定spark分解成多少个task,即spark任务的并行度怎么指定
11.stage的划分
12.数仓和数据库
13.数仓分层 为什么要分层
14.怎么评价数仓的好坏呢? 数据质量管理
15.任务调度怎么做的 除了azkaban还知道什么? 其实还有airflow
16.数据建模方式
17.算法了解什么? 分类 回归
18.讲讲逻辑回归
19.上面讲的时候提到了sigmod激活函数 具体讲讲呗? 确实记不住公式
20.逻辑回归和决策树的优缺点
21.做一个题 牛客sql原题近30天完播率
题目不是很难,但是我timestampdiff函数的参数位置给忘了…面试官提醒了一下做出来了
22.反问
面试官很耐心 很温柔 语速也不快 一笑特别像我初中同学hh
3.21 二面
1.自我介绍
2.香港读研的培养方式 为什么去香港读研 感兴趣的课程 课程的知识体系 (日常被质疑水hh)
3.项目介绍
4.做的项目达到预期了吗
5.数据建模方式
6.数据质量管理怎么做的
7.被质疑项目中数据质量管理的可靠性 比如sql写错了怎么检测到 其实可以对结果抽样 看看数据分布 数据明细等
8.秋招春招的情况
9.回过头来看怎么把项目做的更好
10.你觉得你自我提升的效率怎么样
11.考一道基础的算法题 非递减数组 eg:12334 target=3 输出左右边界
二分查找找边界就可以了
12.反问
3.24 hr面
1.自我介绍
2.为什么想做数据开发
3.工作的主要收获和经历
4.工作时候遇到的最困难的时期 发生了啥
5.和小伙伴横向协作的时候遇到的不达预期的情况
6.对于选择公司的期待和诉求
7.最后又舔了舔 prpr
希望运气好点能收到offer吧 等待的日子还是挺煎熬的
#美团#