***************
Case 1 字节
一面:
对AB test的理解(当时用了哔哩哔哩和头条app举例);
感觉哔哩哔哩和头条哪种产品更好,好在哪里;
对数据运营中的很多名词是否有了解;
次日留存、3日、7日留存率怎么计算,如何反应出一个新产品的好坏;
举了具体的一年中某app的每天的次日留存,如何计算第二年第一天的用户基数,没给的数据可以假设;
深挖简历里的项目;
聊简历的实习,问实习相关的产品数据运营的数据迁移到头条上如何分析;
对数分的理解;
python数据处理相关函数;
Case 2 字节
一面:
自我介绍
简历实习项目深挖,不断地问,问的很深,一定要对自己简历上的项目非常熟悉
SQL:
SQL查询语句的大体框架 (select from 表名 join 表名 on where group by/having order by )
select 和 group by 的执行顺序 :select在group by 之后
哪个函数可以返回排名 row_number() over(partition by order by)
tableau熟练吗
有10个不同的用户群体,我怎么证明对他们投放广告获得的价值是一样的呢?(假设检验)
你有什么问题想问我的吗?
二面:
自我介绍
实习项目深挖,划重点!!自己的简历一定要熟悉,问了好多好多问题。
SQL,表user_time中字段是user_id , time(用户访问时间),求每个用户相邻两次浏览时间之差小于三分钟的次数,只说个思路。
如果一个大学法学院和经管学院整体的男生比例是C,法学院的男生比例是B,经管学院的男生比例是A。现在经过招生,法学院的男生比例是B1,经管学院的男生比例是A1,整体的男生比例是C1。如果A1和B1均比A和B高,那么C1一定比C高吗?举个例子说明一下?
A:20% B:30% 则C在20%~30% 之间
A1:40% B1:50% 则C1在40%~50% 之间 这种情况一定比C高
A1:25% B1:35% 则C1在25%~35% 之间 这种情况不一定比C高
三面:
自我介绍
这两轮面试你有什么收获?
评价一下两位面试官?觉得两位面试官的问题有什么不同?
上次实习主要做了什么?
还问我SQL,spss,Python到底有什么区别?
现在还有别的offer吗?
有什么想问的?
Case 3 字节
一面:
自我介绍
知不知道sql的窗口函数,rank和dense_rank有什么区别
挑个项目讲讲 (我讲得很详细,面试官会对感兴趣的点继续深入问,没听太懂的会让你再解释一遍
RF和GBDT有什么相同和不同,知道哪些loss function, 分类和回归常用的loss function是什么
100个球,A、B两个人一次只能拿1-5个球,A先拿,拿到最后一个球的人赢,请问A有没有什么策略保证必胜。(A先拿4个,然后A+B=6即可)
给出链表的一个头节点和一个要删除的节点,要求在O(1)时间复杂度内删除该节点,并返回头部节点
有什么要问的
二面:
挑个经历讲讲(详细讲了数分实习经历,面试官挖得很深,问了实习中一些指标的意义)
开放地讨论了一下北京市的房价变化(聊了很久很久...从各种角度说,面试官会问那如果出现了xxx的异常情况怎么办呢)
给一个等概率生成 1-5 正整数的发生器random5(),写一个random3()和random7()
有什么想问的
三面:
自我介绍
讲项目
项目里涉及了决策树、RF、极端随机树,比较一下区别、优劣
关于评价指标,介绍一下AUC
结合实际业务问了个AUC相关的问题
结合实际业务,问怎么发现spam
用 (hive) sql 或者 python 写了道取数题
概率题,一个硬币抛三次,三次都是正面向上的概率
四面:
自我介绍
介绍一个数据分析(挖掘)相关的项目
如果给你更多的时间你对项目有什么改进的想法
估计一下谷歌/FB/字节跳动的全年收入
一道sql题,uid, time, 间隔两分钟以内的一次登录算作是作弊,统计每个用户作弊的次数
一道业务题,如果准备向一批新用户投放广告,应该给他们投放什么广告,投放多少广告,投放间隔是多少,会去看哪些指标
二分类问题有哪些评价指标
有什么想问的
Case 4 字节
一面:
深挖简历项目
最常用的APP
有什么用户使用上的缺陷
如何从数据分析师的角度去证明搜索推荐的时效性不好
如何改进,改进后如何看效果
搜索推荐时效性除了是算法问题,还有可能是什么问题导致
反问环节
二面:
简历项目继续深挖
一面问到的小红书问题是否能优化一下,有更好的解决方法
时效性很重要吗
反问环节
三面:
除了小红书再说一个自己常用的APP
疫情对b站的影响
疫情会导致b站up主的创作性下降,内容多样性减少,如何用数据来证明这个观点
如何判断这个up主是某个地区的,除了看他发帖的IP地址
针对版权问题,比如为视频的bgm购买版权,如何去衡量是否要购买版权
未来的职业规划
Case 5 字节
一面:
自我介绍
对字节电商有什么样的了解:讲了实习中做的直播分析
在抖音电商有没有买过东西,有什么体验不好点、或者说改进的点:主播引导,背书能力不够,信任度不高)分析哪些因素会影响用户的信任:从用户行为数据入手,分直播间、主播、商品等维度考虑
做了一个类似淘宝的频道,搭建一个指标体系(用户,收入,商品)
有30个频道,分析透数逻辑(频道筛选,量化频道的潜力和用户的依赖程度):Gmv(看这个指标会存在怎样的弊端),用户使用频次和停留时长
针对数据分析师需要具备什么样的能力,给自己打多少分?
反问:
工作内容和时间占比:产品功能的迭代和复盘(40%),提炼专项分析的主题、case——给业务输出策略、建议(40%),分析提效——数据基建(20%)
如何提升产品sense:做为一个用户代入,横行思考,交叉生态
二面:
自我介绍
为什么选择互联网数据分析岗?
数据分析师没有那么花哨,这个岗位扎实的点需要在哪些部分?并结合自己的优势?:理论知识,软件,业务
抖音电商和淘宝电商在业务模式和业务逻辑上有什么异同点?
异
淘宝:人找货;抖音:货找人
淘宝粘性高,抖音低,复购率也低
抖音客单价小
同
电商,核心在于把货卖出去
把抖音电商做好三个最关键的问题?
商品:筛选
售后、配送
主播:扶持
短视频电商和直播电商的异同
异:时效性、承载内容、转化率高低
同:变现,品牌推广或者做gmv
直播互动方式,从平台侧看评论、点赞、关注的价值
如何量化这个价值
如何保证人群筛选的公平
三者创造价值的行为特征和路径
用户高频地与主播互动如何贡献gmv的价值?
分析师有宏观、中观、微观视角,自己倾向于做什么方向?
首点的位置
找准定位和方法:如何打差异化价值
打造信任体系
服务的用户需求不变,结合的消费场景不同
抖音会泛化垂直场景,中心化
用户场景做无缝衔接,一致性体验
更泛化和更深度的发展:做垂直、独立、更中心化
三面:
前面两轮的面试体验和改进建议
印象深刻的问题
字节实习的工作内容和leader带你的方式
字节和滴滴实习感受的区别
数据分析领域成长最快的两个时间节点
你的优势和不足
对岗位的理解
对平台、团队、直属leader有什么样的诉求
反问:组织架构,成长路线
Case 6 小红书
一面:
自我介绍
讲一个数分的实习经历
SQL题 有两个表(用户点击表、笔记品类对应表)求每个用户点击次数最多的三个笔记品类
从什么角度分析小红书在选秀综艺上投放广告的拉新效果?
用小红书吗?小红书有哪些模块?
假设周五的新用户人均使用时长比周四降低了,怎么分析?
(接上一个问题)考虑到刚才提到的模块还可以怎么分析?
觉得哪里可以改进?
根据上面说的改进点做AB测试,从什么角度来分析?
二面:
自我介绍
深挖数分项目
反问环节
Case 7 拼多多
一面:
自我介绍
实习项目
为什么转专业
大促复盘要看什么
SQL:求连续登录天数最大的用户
二面:
自我介绍
实习项目:如果要继续分析你怎么考虑?遇到什么困难?落地了吗?
之前实习每天怎么安排?工作强度?可以接受pdd的强度吗
觉得笔试难吗?难在哪里,SQL写得怎么样
SQL留存率
辛普森悖论
三面:
深挖实习项目
HR面:
复盘之前的面试:觉得自己表现得怎么样?在哪里有不足?
自我介绍
实习收获
面试业务的竞争格局、拼多多做这个的核心优势
对拼多多的了解、你觉得拼多多的购物体验怎么样、怎么看多多的工作强度
学校除了学习剩下的时间怎么安排、有什么学习方法
三个词形容自己
有什么别人没发现的优点
家庭情况
Case 8 拼多多
一面:
专车分析时最重要的指标?可比性指标?
SQL题
GMV下降怎么分析
A/B test怎么设计
从北京到上海,如何去
假设检验,z检验、t检验、卡方检验等
二面:
淘宝网项目指标选取
专车流量的核心指标,怎么分析
如何量化对购物车的需求
SQL题,这个SQL题有点难,用自连接可以做