当前位置: 首页 > 面试经验 >

快手 数据分析凉经

优质
小牛编辑
146浏览
2023-03-28

快手 数据分析凉经

bg:楼主北京某985大三,信息学科,两段互联网大厂数据分析实习经历(mi+ks),业务偏向电商和广告行业的风控。

快手中台 数据科学

一面(20min)

1.实习中AB实验的背景是什么?实验组和对照组如何选择?得到了哪些结论?

2.得出结论后有继续做实验验证吗?

没有,因为游戏行业2021年被监管,一切优化的业务都毙掉了。

3.实验组按照5%流量随机分流的依据是什么?

这里其实问的是样本量该如何选择,我有了解过相关的理论(假设检验),但是太过久远已经全都忘了,而且实验上线和分流是产品做的,我只负责分析AB实验的结果。

4.有没有做过因果推断方面的研究(DID等)

5.上一段实习的部门是什么,Leader是谁?

楼主上段实习也在快手,所以面试官问了一句

6.sql题:一张表字段有date、device_id、is_new_device,写一个sql计算每天的新设备的留存率(retention_rate = 第一天和第二天is_new_device均为1的设备数 / 第一天is_new_device为1的设备数)

SELECT
date,
CASE WHEN new_current = 0 THEN 0 ELSE round( new_both / new_current, 2 ) END AS retention_rate
FROM (
SELECT
t1.date,
sum( CASE WHEN t1.is_new_device = 1 THEN 1 ELSE 0 END ) AS new_current,
sum( CASE WHEN t1.is_new_device = 1 AND t2.is_new_device = 1 THEN 1 ELSE 0 END ) AS new_both
FROM
`Table` t1
LEFT JOIN `Table` t2 ON t1.device_id = t2.device_id
AND t1.date = date_sub(t2.date, INTERVAL 1 DAY )
GROUP BY
t1.date)t

7.python题:给定一个list(可以看成集合),输出他的全部子集

python太久没用了,所幸语法还记得一些,没闹出太大的笑话。

我知道N元集合的子集可以和Nbits的二进制数构成映射,但我就是想不起来怎么实现,最后用双指针写的(复盘后发现完全不对),但面试官说我有思路(可能是给我找台阶)

def getSubset(list):
N = len(list) // 集合的大小,n元集合的子集数有2 ** n个
ans = []
for i in range(2 ** N):
tmp = []
for j in range(N):
if i >> j % 2:
temp.append(list[j])
ans.append(tmp)
return ans

8.实习到岗时间,能实习多久

9.反问:

这个岗位是在什么部门(快手中台),数据分析还是数据科学(数科)

主要技术栈什么(取数用sql,分析建模python、numpy、pandas、甚至机器学习都要用)

10.感想:

整段面试下来我的感受就是:经历完全不匹配。

我从没想过要面数据科学岗(否则我一定恶补数理统计和Python),看得出来面试官想要和我多聊一些因果推断、AB实验、假设检验的东西,但无奈我真的没做任何准备,只能凭着印象搪塞几句。希望下次遇到匹配一些的岗位吧,以上就是我的一面凉经~

#数据人的面试交流地##我的实习日记##数据分析实习##数据科学#
 类似资料: