面试时间:2024.07.03,共计80分钟
问题 |
自我介绍 |
后面打算是在上海 or 北京 or 其他地方? |
之前工作离职了吗? |
介绍之前工作中参与的项目? - 自己承担了哪些工作? - 在承担的工作中,哪些是挑战 or 难点 or 亮点的工作、怎么解决的? |
数据开发工作流程? - 一个需求流程走完,大概需要多久? - 如果业务方需求上线紧急,但是流程较长,怎么解决? |
模型/字段是如何下线? |
看板数据问题是如何发现的? |
模型重构主要做了哪些工作? 怎么保证重构后模型数据的质量和一致性? 时效性提升多久?原先是几点产出? |
用户专题中的留存率是怎么计算的? 留存率表分区规划? |
数据域和业务过程是怎么划分的? 有哪些核心业务过程? |
成本治理有哪些方案? |
Spark任务中怎么定位是否发生数据倾斜?怎么解决? |
你觉得:B站有哪些数据域?怎么划分业务过程?有哪些北极星指标? |
数据开发前的数据探查做哪些事情? |
介绍一下数据质量? |
职业规划? |
为什么从上一份工作中离职? |
反问环节 |
SQL题目 | 思路 |
最差是第几名(二) | 中位数的变形。牛客原题(难度:较难) |
面试时间:2024.07.05,共计36分钟
问题 |
自我介绍 |
核心指标有哪些? |
为什么要同时观察指标A和指标B? |
指标服务化如何避免指标重复建设? |
两个指标A和B,怎么判断他们本质是不是同一个指标? |
如何保障指标产出的稳定性(产出时间、产出数据正确性)? |
介绍一下基线? |
如果任务可能破线,如何提前进行感知? |
看板数据出了问题,排查思路? |
是否开发过UDF、UDTF函数?介绍开发流程? |
数据平台的计算引擎使用的什么?元数据管理是使用的什么? |
介绍下Hive是什么? |
一份数据 被程序计算为 统计结果,包含哪几步? |
反问环节 |
oc时间:二面结束后2h(当天)。
offer时间:二面结束后5h(当天)。
#数据##数据开发工程师##数据开发工程师面经#