23届秋招面经字节跳动-Data-电商数据科学

优质

小牛编辑

118浏览

2023-03-28

字节跳动提前批：data-电商数据科学

一面，部门成员：～50min

1. 自我介绍

2. 机器学习

a) XGBoost：损失函数推导、特征重要性的计算方法

b) 为什么用SHAP计算特征重要性，不用XGBoost自带的方法（实习项目）

3. AB test

a) 对于不同类型的指标，分别要怎么做统计检验

b) 用非参数方法检验偏态分布的指标，统计功效较低，有什么其他方法

c) 对于CTR、CVR这类比值指标，应该怎么检验

4. 因果推断

a) 介绍Double ML项目：项目背景 & 建模流程；对比其他方法，DML的优劣势

b) 介绍Uplift项目：模型选择 & 建模流程；uplift的评估指标（追问：AUUC和AUC的异同）

c) 场景题：要测算“用户是否下载快手”对“抖音使用时长”的影响，应该怎么设计方案？

5. 概率题

a) 一枚均质硬币，抛到正面停下，抛到反面继续抛；抛硬币的期望次数是？

6. 业务题

a) 抖音的创作者投稿率在短期内大幅下跌，怎么做异动分析？

7. 反问

二面，部门leader：～80min

1. 自我介绍

2. 因果推断

a) 营销投放的高价值用户挖掘（Uplift）

i. 项目背景 & 建模目的（ITE or sub-group HTE）& 建模流程;

ii. 建模前如何选取用户特征：指标体系的搭建、指标选取有什么禁忌；

iii. 依据统计显著性判断重要特征，有什么风险点？如何识别、解决这些风险点？

iv. 针对统计显著的特征，如何根据特征重要性排序、筛选，形成业务策略？

v. 是否对比过不同形式的uplift模型的效果？结果不一致如何取舍？

b）基于观察数据的因果推断项目（Double ML）

i. 项目背景 & 建模流程

ii. 除了DML，是否尝试过其他因果推断的方法？不同方法的结果一致吗，为什么选择采纳DML的结果？

iii. DML框架本身有什么风险点，如何识别、解决？

iv. 建模得出的结论符合业务逻辑吗，有什么业务侧的解释？

v. 如果把这个项目设计成AB test，怎么设计实验方案？

3. AB test

a) 对于不同类型的指标，分别要怎么做统计检验？

b) 指标方差太大，检验不显著，有什么解决方法？

4. 概率（思维）题：

a) 三个药瓶，里面的药可能是每颗1g/2g/3g。只称重一次，如何得知三个瓶子中药的重量分别是多少？

b) 贝叶斯: P（明天是晴天|三个信息源都说明天是晴天）

5. 反问

三面，隔壁部门leader：～70min

1. 自我介绍

2. 因果推断

a) 细挖Uplift项目：项目背景、模型选择、建模流程、评估指标…

b) 对ITE/HTE的理解

c) 匹配方法：CEM/PSM建模流程、对con-founders的理解、平衡性检验怎么做？

d) 针对平衡性检验追问：为什么偏态分布的指标不能用t-test？

3. 业务题

a) 抖音的DAU出现异常波动，怎么做异动分析？

4. 机器学习

a) 如何基于历史数据，预测60天后的DAU？

b) 假设能获取所有用户数据，如何基于个体预测的方法，建立模型？其中可能有什么卡点，如何解决？

纯预测 or 兼顾解释性：深度学习（RNN, attention...）VS. 传统统计模型（ARIMA等时序模型）
卡点：不同生命周期的用户，时序长度不一致 -> 一般用padding，但个人认为不靠谱

c) 面试官解密时刻：如何解决时序长度不一致的问题？

5. 反问

#字节跳动##数据科学##面经#

23届秋招面经字节跳动-Data-电商数据科学

字节跳动提前批：data-电商数据科学

一面，部门成员：～50min

1. 自我介绍

2. 机器学习

3. AB test

4. 因果推断

5. 概率题

6. 业务题

7. 反问

二面，部门leader：～80min

1. 自我介绍

2. 因果推断

3. AB test

4. 概率（思维）题：

5. 反问

三面，隔壁部门leader：～70min

1. 自我介绍

2. 因果推断

3. 业务题

4. 机器学习

5. 反问

热门公司

相关阅读

推荐文章

推荐题库

推荐问答

23届秋招面经 字节跳动-Data-电商 数据科学

字节跳动提前批：data-电商 数据科学

一面，部门成员：～50min

1. 自我介绍

2. 机器学习

3. AB test

4. 因果推断

5. 概率题

6. 业务题

7. 反问

二面，部门leader：～80min

1. 自我介绍

2. 因果推断

3. AB test

4. 概率（思维）题：

5. 反问

三面，隔壁部门leader：～70min

1. 自我介绍

2. 因果推断

3. 业务题

4. 机器学习

5. 反问

热门公司

相关阅读

推荐文章

推荐题库

推荐问答

23届秋招面经字节跳动-Data-电商数据科学

字节跳动提前批：data-电商数据科学