当前位置: 首页 > 面试经验 >

数据开发面经(上海Bilibili)

优质
小牛编辑
94浏览
2024-07-17

数据开发面经(上海Bilibili)

一面:

面试时间:2024.07.03,共计80分钟

  1. 全程项目经历,在工作中做的事情。
  2. 按着简历上写的"工作内容",一条一条的问。

问题

自我介绍

后面打算是在上海 or 北京 or 其他地方?

之前工作离职了吗?

介绍之前工作中参与的项目?

- 自己承担了哪些工作?

- 在承担的工作中,哪些是挑战 or 难点 or 亮点的工作、怎么解决的?

数据开发工作流程?

- 一个需求流程走完,大概需要多久?

- 如果业务方需求上线紧急,但是流程较长,怎么解决?

模型/字段是如何下线?

看板数据问题是如何发现的?

模型重构主要做了哪些工作?

怎么保证重构后模型数据的质量和一致性?

时效性提升多久?原先是几点产出?

用户专题中的留存率是怎么计算的?

留存率表分区规划?

数据域和业务过程是怎么划分的?

有哪些核心业务过程?

成本治理有哪些方案?

Spark任务中怎么定位是否发生数据倾斜?怎么解决?

你觉得:B站有哪些数据域?怎么划分业务过程?有哪些北极星指标?

数据开发前的数据探查做哪些事情?

介绍一下数据质量?

职业规划?

为什么从上一份工作中离职?

反问环节

SQL题目

思路

最差是第几名(二)

中位数的变形。牛客原题(难度:较难)

二面:

面试时间:2024.07.05,共计36分钟

  1. 全程项目经历,在工作中做的事情。

问题

自我介绍

核心指标有哪些?

为什么要同时观察指标A和指标B?

指标服务化如何避免指标重复建设?

两个指标A和B,怎么判断他们本质是不是同一个指标?

如何保障指标产出的稳定性(产出时间、产出数据正确性)?

介绍一下基线?

如果任务可能破线,如何提前进行感知?

看板数据出了问题,排查思路?

是否开发过UDF、UDTF函数?介绍开发流程?

数据平台的计算引擎使用的什么?元数据管理是使用的什么?

介绍下Hive是什么?

一份数据 被程序计算为 统计结果,包含哪几步?

反问环节

offer:

oc时间:二面结束后2h(当天)。

offer时间:二面结束后5h(当天)。

#数据##数据开发工程师##数据开发工程师面经#
 类似资料: