当前位置: 首页 > 面试经验 >

数据分析-1 面经23

优质
小牛编辑
156浏览
2023-03-28

数据分析-1 面经23

***************

Case 1 字节

一面:

  1.   对AB test的理解(当时用了哔哩哔哩和头条app举例);
    
  2.   感觉哔哩哔哩和头条哪种产品更好,好在哪里;
    
  3.   对数据运营中的很多名词是否有了解;
    
  4.   次日留存、3日、7日留存率怎么计算,如何反应出一个新产品的好坏;
    
  5.   举了具体的一年中某app的每天的次日留存,如何计算第二年第一天的用户基数,没给的数据可以假设;
    
  6.   深挖简历里的项目;
    
  7.   聊简历的实习,问实习相关的产品数据运营的数据迁移到头条上如何分析;
    
  8.   对数分的理解;
    
  9.   python数据处理相关函数;
    

Case 2 字节

一面:

  1.   自我介绍
    
  2.   简历实习项目深挖,不断地问,问的很深,一定要对自己简历上的项目非常熟悉
    
  3.   SQL:
    

SQL查询语句的大体框架 (select from 表名 join 表名 on where group by/having order by )

select 和 group by 的执行顺序 :select在group by 之后

哪个函数可以返回排名 row_number() over(partition by order by)

  1.   tableau熟练吗
    
  2.   有10个不同的用户群体,我怎么证明对他们投放广告获得的价值是一样的呢?(假设检验)
    
  3.   你有什么问题想问我的吗?
    

二面:

  1.   自我介绍
    
  2.   实习项目深挖,划重点!!自己的简历一定要熟悉,问了好多好多问题。
    
  3.   SQL,表user_time中字段是user_id , time(用户访问时间),求每个用户相邻两次浏览时间之差小于三分钟的次数,只说个思路。
    
  4.   如果一个大学法学院和经管学院整体的男生比例是C,法学院的男生比例是B,经管学院的男生比例是A。现在经过招生,法学院的男生比例是B1,经管学院的男生比例是A1,整体的男生比例是C1。如果A1和B1均比A和B高,那么C1一定比C高吗?举个例子说明一下?
    

A:20% B:30% 则C在20%~30% 之间

A1:40% B1:50% 则C1在40%~50% 之间 这种情况一定比C高

A1:25% B1:35% 则C1在25%~35% 之间 这种情况不一定比C高

三面:

  1.   自我介绍
    
  2.   这两轮面试你有什么收获?
    
  3.   评价一下两位面试官?觉得两位面试官的问题有什么不同?
    
  4.   上次实习主要做了什么?
    
  5.   还问我SQL,spss,Python到底有什么区别?
    
  6.   现在还有别的offer吗?
    
  7.   有什么想问的?
    

Case 3 字节

一面:

  1.   自我介绍
    
  2.   知不知道sql的窗口函数,rank和dense_rank有什么区别
    
  3.   挑个项目讲讲 (我讲得很详细,面试官会对感兴趣的点继续深入问,没听太懂的会让你再解释一遍
    
  4.   RF和GBDT有什么相同和不同,知道哪些loss function, 分类和回归常用的loss function是什么
    
  5.   100个球,A、B两个人一次只能拿1-5个球,A先拿,拿到最后一个球的人赢,请问A有没有什么策略保证必胜。(A先拿4个,然后A+B=6即可)
    
  6.   给出链表的一个头节点和一个要删除的节点,要求在O(1)时间复杂度内删除该节点,并返回头部节点
    
  7.   有什么要问的
    

二面:

  1.   挑个经历讲讲(详细讲了数分实习经历,面试官挖得很深,问了实习中一些指标的意义)
    
  2.   开放地讨论了一下北京市的房价变化(聊了很久很久...从各种角度说,面试官会问那如果出现了xxx的异常情况怎么办呢)
    
  3.   给一个等概率生成 1-5 正整数的发生器random5(),写一个random3()和random7()
    
  4.   有什么想问的
    

三面:

  1.   自我介绍
    
  2.   讲项目
    
  3.   项目里涉及了决策树、RF、极端随机树,比较一下区别、优劣
    
  4.   关于评价指标,介绍一下AUC
    
  5.   结合实际业务问了个AUC相关的问题
    
  6.   结合实际业务,问怎么发现spam
    
  7.   用 (hive) sql 或者 python 写了道取数题
    
  8.   概率题,一个硬币抛三次,三次都是正面向上的概率
    

四面:

  1.   自我介绍
    
  2.   介绍一个数据分析(挖掘)相关的项目
    
  3.   如果给你更多的时间你对项目有什么改进的想法
    
  4.   估计一下谷歌/FB/字节跳动的全年收入
    
  5.   一道sql题,uid, time, 间隔两分钟以内的一次登录算作是作弊,统计每个用户作弊的次数
    
  6.   一道业务题,如果准备向一批新用户投放广告,应该给他们投放什么广告,投放多少广告,投放间隔是多少,会去看哪些指标
    
  7.   二分类问题有哪些评价指标
    
  8.   有什么想问的
    

Case 4 字节

一面:

  1.   深挖简历项目
    
  2.   最常用的APP
    
  3.   有什么用户使用上的缺陷
    
  4.   如何从数据分析师的角度去证明搜索推荐的时效性不好
    
  5.   如何改进,改进后如何看效果
    
  6.   搜索推荐时效性除了是算法问题,还有可能是什么问题导致
    
  7.   反问环节
    

二面:

  1.   简历项目继续深挖
    
  2.   一面问到的小红书问题是否能优化一下,有更好的解决方法
    
  3.   时效性很重要吗
    
  4.   反问环节
    

三面:

  1.   除了小红书再说一个自己常用的APP
    
  2.   疫情对b站的影响
    
  3.   疫情会导致b站up主的创作性下降,内容多样性减少,如何用数据来证明这个观点
    
  4.   如何判断这个up主是某个地区的,除了看他发帖的IP地址
    
  5.   针对版权问题,比如为视频的bgm购买版权,如何去衡量是否要购买版权
    
  6.   未来的职业规划
    

Case 5 字节

一面:

  1.   自我介绍
    
  2.   对字节电商有什么样的了解:讲了实习中做的直播分析
    
  3.   在抖音电商有没有买过东西,有什么体验不好点、或者说改进的点:主播引导,背书能力不够,信任度不高)分析哪些因素会影响用户的信任:从用户行为数据入手,分直播间、主播、商品等维度考虑
    
  4.   做了一个类似淘宝的频道,搭建一个指标体系(用户,收入,商品)
    
  5.   有30个频道,分析透数逻辑(频道筛选,量化频道的潜力和用户的依赖程度):Gmv(看这个指标会存在怎样的弊端),用户使用频次和停留时长
    
  6.   针对数据分析师需要具备什么样的能力,给自己打多少分?
    
  7.   反问:
    

工作内容和时间占比:产品功能的迭代和复盘(40%),提炼专项分析的主题、case——给业务输出策略、建议(40%),分析提效——数据基建(20%)

如何提升产品sense:做为一个用户代入,横行思考,交叉生态

二面:

  1.   自我介绍
    
  2.   为什么选择互联网数据分析岗?
    
  3.   数据分析师没有那么花哨,这个岗位扎实的点需要在哪些部分?并结合自己的优势?:理论知识,软件,业务
    
  4.   抖音电商和淘宝电商在业务模式和业务逻辑上有什么异同点?
    

淘宝:人找货;抖音:货找人

淘宝粘性高,抖音低,复购率也低

抖音客单价小

电商,核心在于把货卖出去

  1.   把抖音电商做好三个最关键的问题?
    

商品:筛选

售后、配送

主播:扶持

  1.   短视频电商和直播电商的异同
    

异:时效性、承载内容、转化率高低

同:变现,品牌推广或者做gmv

  1.   直播互动方式,从平台侧看评论、点赞、关注的价值
    

如何量化这个价值

如何保证人群筛选的公平

三者创造价值的行为特征和路径

  1.   用户高频地与主播互动如何贡献gmv的价值?
    
  2.   分析师有宏观、中观、微观视角,自己倾向于做什么方向?
    
  3. 在微观的话需要从用户的角度抽离出来,觉得自己有优势吗?或者分享case
  4. 用户对搜索功能满意度的最关键的一个指标? 频次

首点的位置

  1. 最亮眼的一个优势和不足
  2. 抖音需要发力的三个关键点 关注竞对

找准定位和方法:如何打差异化价值

打造信任体系

  1. 反问: 两种直播电商未来怎么看?

服务的用户需求不变,结合的消费场景不同

抖音会泛化垂直场景,中心化

用户场景做无缝衔接,一致性体验

  1. 抖音电商的定位 价值:抖音端内带来内容价值,不能只考虑gmv

更泛化和更深度的发展:做垂直、独立、更中心化

  1. 短期/长期目标

三面:

  1.   前面两轮的面试体验和改进建议
    
  2.   印象深刻的问题
    
  3.   字节实习的工作内容和leader带你的方式
    
  4.   字节和滴滴实习感受的区别
    
  5.   数据分析领域成长最快的两个时间节点
    
  6.   你的优势和不足
    
  7.   对岗位的理解
    
  8.   对平台、团队、直属leader有什么样的诉求
    
  9.    反问:组织架构,成长路线
    

Case 6 小红书

一面:

  1.   自我介绍
    
  2.   讲一个数分的实习经历
    
  3.   SQL题 有两个表(用户点击表、笔记品类对应表)求每个用户点击次数最多的三个笔记品类
    
  4.   从什么角度分析小红书在选秀综艺上投放广告的拉新效果?
    
  5.   用小红书吗?小红书有哪些模块?
    
  6.   假设周五的新用户人均使用时长比周四降低了,怎么分析?
    
  7.   (接上一个问题)考虑到刚才提到的模块还可以怎么分析?
    
  8.   觉得哪里可以改进?
    
  9.   根据上面说的改进点做AB测试,从什么角度来分析?
    

二面:

  1.   自我介绍
    
  2.   深挖数分项目
    
  3.   反问环节
    

Case 7 拼多多

一面:

  1.   自我介绍
    
  2.   实习项目
    
  3.   为什么转专业
    
  4. ab实验 最小样本量和方差、统计功效的关系
    常用假设检验方法、Z检验和t检验的使用场景 200个样本用什么检验、样本量只有10呢? 对于点击率指标有两个统计方案,一是7天累计(看点击用户数),二是每天算一个点击率,哪种更好
  5.   大促复盘要看什么
    
  6.   SQL:求连续登录天数最大的用户
    

二面:

  1.   自我介绍
    
  2.   实习项目:如果要继续分析你怎么考虑?遇到什么困难?落地了吗?
    
  3.   之前实习每天怎么安排?工作强度?可以接受pdd的强度吗
    
  4.   觉得笔试难吗?难在哪里,SQL写得怎么样
    
  5. 平时写SQL用hive还是MySQL? 两者有什么区别 MySQL为什么现在用得少了
  6.   SQL留存率
    
  7.   辛普森悖论
    

三面:

  1.   深挖实习项目
    

HR面:

  1.   复盘之前的面试:觉得自己表现得怎么样?在哪里有不足?
    
  2.   自我介绍
    
  3.   实习收获
    
  4.   面试业务的竞争格局、拼多多做这个的核心优势
    
  5.   对拼多多的了解、你觉得拼多多的购物体验怎么样、怎么看多多的工作强度
    
  6.   学校除了学习剩下的时间怎么安排、有什么学习方法
    
  7.   三个词形容自己
    
  8.   有什么别人没发现的优点
    
  9.   家庭情况
    

Case 8 拼多多

一面:

  1.   专车分析时最重要的指标?可比性指标?
    
  2.   SQL题
    
  3.   GMV下降怎么分析
    
  4.   A/B test怎么设计
    
  5.   从北京到上海,如何去
    
  6.   假设检验,z检验、t检验、卡方检验等
    

二面:

  1.   淘宝网项目指标选取
    
  2.   专车流量的核心指标,怎么分析
    
  3.   如何量化对购物车的需求
    
  4.   SQL题,这个SQL题有点难,用自连接可以做
    
#面经##实习##校招#
 类似资料: