整体流程:30min 项目 + 两道sql 离线数仓 + 指标计算 1、聊聊离线数仓 2、介绍数仓主题、数仓分层? 3、DWD和ADS层的区别? 4、数仓表数量、数据量多大?数据量级的困难,计算参数 5、快速完成ODS表的清洗和过滤? 6、实现最复杂的UDF?继承Hive UDF类?其他的UDF类?GenericUDTF 和 UDF区别? 7、计算引擎选择?为什么计算量大却选择Hive计算引擎?
复盘一下,感觉可能🈚️了…… 感觉非常偏产品…… 1、项目深挖,挖的太细了,会一直追问为什么为什么为什么背后的逻辑是什么 引申出的问题:辛普森悖论的后验、如何衡量一个活动的效果、ROI分子分母讨论,都是基于实习 2、产品题目 最喜欢的app 举了一个策略要上线的例子,问一开始怎么设计指标体系、怎么预估要不要上线、上线时怎么设计实验、ab实验怎么评估、要哪些指标、如果显著了怎么证明是因为策略 3、
有朋友了解集度数分团队Base北京吗? 第一轮 1.自我介绍 2.SQL 3.简历 4.常用软件及盈利模式 5.追问:如果给这个软件的CEO做一个看板,思路是什么,需要包含哪些内容 6.GMV 上海市 目标增长1000w,如何给业务细分目标 7.追问:如果第一个月就涨了120w,是什么原因,如何和业务沟通 8.预测未来12月的汽车销量 9.追问:如果有其他产品的历史销量记录,如何预测 10.异动:
复盘下之前的oppo一面,真的很tech,感觉像是在招ds 1. python以及sql中处理字符串和日期的函数 2 有什么窗口函数 加不加order by的区别 3 机器学习了解哪些模型 4 介绍下随机森林的原理 5 随机森林分支的规则是啥?决策树不再往下分的原理是啥 6 介绍学校项目从最开始的数据获取 治理等等其中处理的难点是啥,整体看板搭建思路如何 7 如何评估数据的集中程度以及分散程度 8
一面(11/7: 自我介绍 面试官说该岗还是要会一点算法,问我学过没 两道算法题,只用提供思路(应该是看我没咋学过 一个特征平方和为100的分类任务怎么解决 最有含金量的项目 为什么要用深度学习(而不是单层神经网络 反问: 要分析游戏数据吗,hr答:腾讯不让做游戏😂
快手-数分实习-mentor一面-25min 1、自我介绍&问项目 2、快手要吸引服饰广告主,需要输出什么样的报告 3、你认为数据分析这个岗位的作用是什么 4、优缺点 5、如果你发现数据有一个异常波动,急于向上游寻求答复,而ta回复的比较慢或回复意愿不大,怎么办 6、如果要对接一个项目并交付,有什么注意的点 7、对于重复枯燥的工作怎么看 二面交叉面-45min 1、自我介绍 2、如何分析直
都问些什么呀 会有case题吗 求面筋 更新; 自我介绍 简历深挖 问了一个因果推断/相关分析的问题 之前面试没被问到过呆住 知不知道斯皮尔曼相关系数的优缺点 😅
发一发最近的面经 大概20分钟,感觉有点水,最后应该是把我挂了 1、自我介绍 2、选择岗位、行业、企业的时候会考虑哪些因素 3、问tx实习的时候有什么最难的项目,是怎么解决的,有什么产出 4、数分项目中主要关注哪些数据指标、如何拆解、如何量化 5、输出了哪些数据报告,有什么结论和产出 6、工作中,导师对你的意义是什么? 7、场景提问,网课老师授课一学期,然后会有部分学生会转入下学期,期间会产生一系
发一发最近的面经 大概40分钟 1、自我介绍 2、结合实习项目,详细讲一个数据分析的案例 3、这个数分案例的原因、目的、产出 4、结合实习项目问脏数据清洗的过程,解决方案 5、join有几种,各自的区别 6、拿两张业务表问left join的细节 7、where和having的区别 8、sql函数执行顺序 9、知道哪些窗口函数 10、有个用户观看视频的表,写sql,得到不同地区播放量前100的视频
面试方向为风控,2次业务面+1次hr面,深挖简历的问题就跳过了 一面 1.职业规划,为什么想做数分 2.标准异动归因题 3.sql题:学生id,课程,分数三列的表,口述sql思路,取出所有分数在平均分以上的学生的分数记录 4.对短视频行业的看法 二面 1. 给你全量用户的全量信息,怎么从所有举报信息中分析app大盘是否健康? 2. 在游戏聊天系统内怎么搭建风控核心指标体系? 3. 深入探讨职业规划
面试方向为风控,2次业务面+1次hr面,已意向,深挖简历的问题就跳过了 一面 1h 1.职业规划,为什么想做数分 2.标准异动归因题 3.sql题:学生id,课程,分数三列的表,口述sql思路,取出所有分数在平均分以上的学生的分数记录 4.对短视频行业的看法 二面 1h 1. 给你全量用户的全量信息,怎么从所有举报信息中分析app大盘是否健康? 先从大盘,即全量用户圈定重度和新增,再看举报用户中对
部门是欺诈风险风控,简历没深挖,实习经历啥的都是随便问两句,像是hr面一样,估计KPI;然后问了两个业务场景问题: 1.如何识别快手异常涨粉; 2.如何预估未成年人直播用户数; 对这种场景业务题一窍不通,哭了,答得很不好; 然后写了道概率题,题目意思没理解,想了半天没想出来;面试官看我没理解题目然后换了道简单的,说了思路后就说面完了,反问问了对方业务部门情况后,然后就是感谢你的时间。
好多天之前的面试了,没信儿了应该挂了 字节-tiktok海外业务(开始让面试官简单介绍一下)-数据分析,一面,40mins: 1、自我介绍 2、深挖简历:遇到的问题、解决方法、对实习经历中业务的理解 3、深挖项目:分析逻辑,指标拆解,评估指标等 4、代码:sql,给业务场景(视频、分区、播放量排序问题等),回答分析逻辑和主要函数,重点是考察窗口函数 5、英语口语询问,商务对话考察、英语阅读和文书能
实习和经历: 1. 介绍一个自己的项目 2. 你在这个项目中遇到的困难有什么 3. 你做过最有成就感的事 4. 你最受挫折的事 5. 有没有协调两个组织共同完成事务的经验 业务: 1. GMV下降异动分析 2. 讲一下做的数据报表项目 反问: 1. 有几面:三面 2. 怎么提高:把看板项目往指标构建异动分析靠一靠,说得更有逻辑一点 3. 工作内容:业务方面的分析,用模型较少,感觉你用模型比较多 不
自我介绍 讲一个重要的项目,针对项目提问。 sql题 Python题(面的时候没想出来,面完就知道怎么写了,服了😅) 反问 一共35min,这不是纯纯kpi吗 #数分# #秋招#