短视频平台-数据方向

优质

小牛编辑

181浏览

2023-03-28

短视频平台-数据方向

> 投递的第一家秋招拿到理想结果，感觉很奇妙~初返京回到办公司实地办公，总担心面试时间和上班时间冲突...但三轮面试分别是周五晚上、周五晚上、周六上午，当时每周周五都只上半天班（2个半小时QAQ 不可思议）、完美避开工作时间。当然，从面试时间也窥得此部门怕是会卷生卷死，不过工作内容很喜欢hhh

>时间线：周日投递->两个工作日后约当周周五一面->两个工作日后约当周周五二面->两个工作日后给time slots自行选择->半多个月后周六面试->两个工作日后发意愿

三场面试的面试官都对我的智力和体力进行了降维打击，我的心态也从求职的紧张焦虑转换成了向面试官学习的坦然轻松——逐渐自己的短板、并能够即使获得面试官的反馈，这是我最大的收获。

话不多说，题目总结开始。

一面

没有自我介绍，面试官激情在线发问，直言我适合产品分析、担心我无法胜任算法向数据科学。

我据理力争、表明强烈意愿，现在回想：可能是真诚打动了面试官orz

（一）行为/业务面

过往实习/学习过程中最满意的一个项目？
从小商家角度，分析购买流量的效果、评估购买流量的质量？

（二）技术面

1. 统计/实验

几何分布扔硬币
钟形右偏分布如何进行假设检验？非钟形的偏态分布如何检验？
常见的方差缩减方法
常见指标的假设检验方式有哪些？
trigger率极低，power极小，如何处理？
基于观察性数据的因果推断方法介绍

2. 概率/脑筋急转弯

扔两个筛子，构建1/6等概率事件。（求和对6取模）
尝试确定1-100楼扔鸡蛋鸡蛋不碎的最高楼层，假设1先验分布均匀分布，假设2如果k楼鸡蛋碎、k+1楼鸡蛋一定碎。给出求解策略，不需要给出具体结果。（动态优化）

（三）反问环节

日常工作做啥？1).精细化研究分析，举了一个XX推荐的例子；2).处理混排策略下的业务部门疑难杂症。

二面

周五一面面试完，下周一电话通知进入二面。二面面试官考察实验和因果推断更加深入，并且不止从业务部门、数据分析部门还会从实验平台部门的角度进行考察，并且循循善诱、让我感受到了交流的平等与尊重——很是意外，这是除了在****面试之外唯一一次给我这样的感觉（内心OS：这家公司竟然能做到，是我看走眼了）。

这场面试一开场面试官就对在**的实习不建模导向很奇怪，我花了大概2分钟讲解了个中缘由，面试官表示没感受到****的变化...

（一）行为/业务面

DAU下降如何分析？（异动归因）
如何评估竞品上线新功能对我司产品的影响？
为什么当前实习不数据科学？
怎么进行项目的优先级排序？

（二）技术面

1. 统计/实验

实验分析流程与步骤
aa阶段目的是什么
常见指标的假设检验方式
为什么对aggregate metric要拆分或者bootstrapping？用bootstrapping为啥能提高power？用bootstrapping太消耗算力了吧？
【回答完才意识到面试官只是想简单问一下假设检验分布，不需要考虑velocity和power sensitivity的问题...是我自己想多了；
关于提高power纠缠了很久因为我默认的是线下分流，面试官默认的是线上分流；
第三个问题我也没想好，但是case by case评估Metrics 进行bootstrapping的ROI】
10000次aa实验p值近似什么分布？如果是均匀分布，那通过aa实验的频率大于95%正不正常？（设置α=0.05）
如果aa通过不了怎么处理？（cuped, rehash, matching）
如果能够知道用户安装应用清单与具体时间，怎么深入定量分析竞品影响？
matching一阶段回归对于变量选择的限制，以及实际操作中个人的偏好
怎么解释互为因果，怎么处理互为因果？
因果推断中观察性因果的常见流派，个人偏好以及理由？

2. 概率/脑筋急转弯

下雨阴天，说谎实话，判断真实天气情况（贝叶斯/intuitive answering）
10000坛毒酒，喝下有毒的酒会在23-24小时后毒发身亡，试问最少用多少犯人可以在48小时内筛选出来有毒的酒？

（三）反问环节

日常工作做啥？1.精细化研究分析，举了一个电商推荐的例子；2.处理混排策略下的业务部门的疑难杂症。
你们做的分析能落地吗？
怎么让其他部门buy in 你们的分析? ——【面试官邪魅一笑，“真相只有一个。”

三面

二面之后一个工作日就来了三面消息，但当时赶在OKR冲刺阶段...我选择了延后三面到半个月之后（期间无比后悔这个决定，一方面忙完OKR项目，又来了新的项目...另一方面担惊受怕招满了人）——但可能因为心太大，面试那天睡过了头...好在面试前20分钟自然醒了。

三面面试是我面得最吃力的一轮——面试官是一位很温柔同时很坚定的女性，对于我的项目她有着无数个“为什么”、并且步步为营步步紧逼，可以说对于****的算法理解她多问我一个问题我就要崩溃了...详见下文吧

（一）个人项目

跟我讲一讲你参加的****项目，为啥数据会出这样的BUG？这个项目的初衷是什么？
****理论上的结果会是什么样子的？
为什么理论上会出现这样的结果呢？现在行业实践一般是什么方式呢？
****实际上在权衡哪些方面的问题呢？***和****之间到底是什么关系呢？
****现实中的结果又是什么样子的？你怎么理解这样的结果呢？
你了解XX算法的最终目标吗？为什么会是这些目标呢？
如果你需要对**进行定价，你会从哪些维度进行评估？
对于****项目，现在你个人怎么理解呢？
对于ZZ和YY这两个指标，怎么实现准确且令人信服的置换计算呢？

> 在此我十分感谢上一份实习的mentor，她让我一个小朋友能够接触如此宏大且复杂的项目是对我充满了信心和期待的、每周一次的11都会远超1个小时、掏心窝教我很多数据以外的知识，每周都会带着一个乳臭未干、不服天不服地的小毛孩在各条业务技术总监的面前晃来晃去；但我也很惭愧因为学校事情+后期摆烂，辜负了她的信任唉 anyway，hope our paths will cross again in the furue...

> 回头想，如果我是当时我的mentor，我就算再看好一个小朋友，也不会带他做这种这么宏大的项目，纯属劳心费力...这次三面面试官表示我的mentor十分出色、能力极强，也就是她能够让我对复杂业务逻辑/现实公司场景有这样的理解，而这些也是这份工作所需要的。

（二）技术面

这一轮面试官只提问了一个问题orz一个问题问了半个小时...“如何进行指标检验”

连续型变量、离散变量、平均值分别如何检验？
t检验和z检验的不同
为什么构建了这样一个统计量来检验样本比例指标呢？
这里跑偏了，我一直在推导近似正态分布的处理...试图化简出结果
但后来反应过来只需要说原理：均值->中心极限定理
说几种你知道的中心极限定理，假设分别是什么？【这里我漏掉了一个假设，面试官据此开始引导...但我没反应过来
右偏分布选择什么假设检验比较好呢？为什么不能用z检验呢？
中心极限定理一定成立吗？右偏分布要多右偏才不成立？
卡方检验和t检验/z检验相比，哪一个更灵敏呢？为什么？
bootstrap能够缩小方差吗？为什么能够缩小方差？
通过bootstrap怎么构造置信区间呢？举个例子？
XXXX公司全部指标都是bootstrap吗？为什么呢？
检验太灵敏是好事吗？
能详细讲一讲AA阶段指标差异都有哪些来源呢，你会选择怎么平衡他们呢？
如果这样你能设计一个实验来系统检验一下我们选取的检验方式是否过于敏感
设计实验来检验检验方式需要MDE？
就此我与面试官产生了分歧
我认为这是需要的。从假设检验角度来看我们确实应该更加focus在第一类错误上，但前提是我们的原假设选择是正确的——或者说原假设应当是保守的、亦或者说我们希望备择假设是成立的，但是在此情境下我们的原假设（不过于敏感）选择是错误的，所以我们需要控制第二类错误、需要MDE。同理，如果我们想要建立正确的原假设，此时也需要构建错误MDE来构造原假设。综上，无论如何都需要MDE。
但面试官认为并不需要。

（三）反问环节

两个办公室的定位有何差异？智能上目前是否明确？

短视频平台-数据方向

一面

（一）行为/业务面

（二）技术面

1. 统计/实验

2. 概率/脑筋急转弯

（三）反问环节

二面

（一）行为/业务面

（二）技术面

1. 统计/实验

2. 概率/脑筋急转弯

（三）反问环节

三面

（一）个人项目

（二）技术面

（三）反问环节

发放意愿

热门公司

相关阅读

推荐文章

推荐题库

推荐问答