9.12 一面结束后半小时飞速约了二面,9.14 二面
- 自我介绍
- 为什么读研
- 为什么转专业
- 你对大数据的理解
- 介绍一下实习组内的分工、数仓架构
- 以商品域为例,数据的模型/表有哪些,从哪些角度评价数据模型
- 你们组具体的宏观的业务流程
- 具体是怎么和其他部门协作的,流程是怎么样
- 你是怎么理解数开的工作的,你个人的偏好是哪方向
- 数据库的范式、事务
- 范式建模、维度建模对比,适用具体场景
- 你了解哪些排序算法,详细讲讲冒泡排序和快速排序
- 对于小规模的数据比如学校成绩表、课程表等等建设数仓是否一定要使用维度建模
- 看你写了 kimball 的维度建模,你对维度建模的理解
- MR 流程
- MR 的并行度是由什么决定的
- 一个场景:两表Join,然后 group by 计算指标,写入一张表,这种场景可能会出现哪些潜在的问题
- 你有很多任务优化的经验,你的具体思路是怎样的
- 你之前谈到的数据质量,具体包括哪些,如何去实现的,以及如何量化
- 你了解 Doris,ClickHouse 之类的 OLAP 引擎吗,和 Hadoop、Hive、Spark 这些有什么区别,具体场景是哪些
- 你目前的秋招进度是怎样的,投了哪些公司
- 没做题
- 反问环节:业务、数仓架构、技术栈等