一面: 1.简历深挖,两个实习经历➕一个项目经历 2.由简历项目中的问题延伸到业务问题,比如,DAU 在某一天下降,如何找原因;给项目中提到的小程序设立关键指标;小程序中某个功能点的优缺点 3.介绍具体AB test 的流程 4.在工作中,最不能接受的事 5.反问环节 二面: 1.介绍一个与数分相关的经验,借此深挖背景,过程,产出,待优化点 2.平时使用哪个产品;大概介绍下抖音的特点 3.抖音需要
自我介绍 问了实习的一些内容,用户路径分析 剩余的其他问题基本上全是业务问题,最喜欢的app是什么?如何构建这个app的指标体系?核心指标下降怎么分析? 大概半小时左右,感觉有点kpi 还是许愿期待一个二面 第二天就感谢信了嘿嘿 速度真快啊#秋招##面经##字节跳动##数据分析#
9.7投递,9号电话约面15号(后因面试官临时有事改为19号) 字节的面试开放性很高,都是根据简历来 自我介绍 根据实习和项目问问题:为什么用线性回归模型,为什么用KNN,怎么向不懂的人直白地介绍KNN,怎么优化预测算法,更多的预测算法 介绍常用的app:网易云音乐,介绍下不足:推荐算法不准确,怎么优化算法,怎么测试优化后的算法:ABtest,怎么给推荐算法的数据集设置权重并验证,怎么确认是推荐算
一面, 面试官很nice,一直在带着你回答问题,但是我本身感觉不是很好,好多问题想得太复杂了又想不出来, 流程就是 面试官介绍然后自我介绍, 之后刷实习经历和项目经历, 会一个问题一直问到不会为止, 然后问平常比较喜欢用什么视频软件, 我回答是抖音,问了我一些体验不是很好的地方, 我说的是重复推荐一些搜索过的视频, 之后问怎么解决,怎么确定指标,然后A/B实验,怎么确定实验结果是置信的 最后反问
1、数据仓库分层了解吗,实时离线都怎么做的? 2、Spark有哪些分区器? 3、宽窄依赖的定义?发生宽窄依赖转换的时候会发生什么操作? 4、shuffle操作增加了什么开销?底层用的什么算法? 5、Spark内存模型有了解过吗? 6、如何解决数据倾斜问题? 7、Flink了解吗?checkpoint机制做什么用的?底层怎么实现的? 8、Spark没有checkpoint机制,那么中间计算结果怎么保
回馈一下 tl:9.20投简历-9.21笔试-9.25一面 1. 自我介绍 2. 简历提问 讲了两段实习 没有太深挖 3. 对于生活服务业务的理解 lz真的不了解😅 随便按照jd上胡扯了一下 好像理解错了😅 4. 指标异动类问题 GMV下降怎么分析 5. 指标体系类问题 - 发站内信提醒购买的人消费 怎么搭建指标体系 6. 怎么明确5的效果是显著的 7. ab基础知识/p-value/t z
整体评价:字节面试难度确实相对来说还是比较大的,特别是二面,会特别考验下面试者的一些软性能力,例如对于商业化的敏感度和数据意识。 一面: 1. 简单讲下你使用关联规则算法进行捆绑销售的项目,在项目开始之前有预估预期收益么? 2. 接1,整体来看还是采取了AA Test,那么你认为整个实验中有哪些问题会影响AA Test效果? 3. 如何根据达人营销业务来制定指标体系?(假设北极星指标是GMV) 4
刚刚面完三面,感觉要凉了… 分享一下面经攒点好运吧 一面8.30 40 mins 项目深挖 介绍一个常用的APP和其优缺点 追问:如何改进这些缺点 追问:选择这样改进的原因 追问:需要选择的观测指标 追问:如果要看改进的效果,如何开展AB实验呢? 核心指标显著正向,一定能上线吗? 第二天HR电话约面 二面9.8 50 mins 项目深挖 抖音电商值得改进的地方? 改进后如何评估效果?观察哪
9.20 24届非科班本发面筋攒好运! 第一次面+太紧张+基础不好+算法出没见过的hard = 寄 组是偏基础架构的 自我介绍到一半简介项目的时候就被打断了开始撕项目(乐 学习的方法 离线项目: 1.分层的好处,为什么分层 2.idmapping 3.拉链表的逻辑(用户活跃区间的中间表),下次还应该解释一下这个中间表的好处以及为什么方便。 实时项目: 1.维表动态注入的意义在哪里,为什么不直接写入
1. 自我介绍 2. 秋招投递进度/方向/职业规划 3. 讲数据分析项目 4. 项目中用到模型的优缺点 (不是原理,是特点!什么场景选什么模型 我:都跑一边看哪个准确率高 面试官:………) 5. 其他数据分析的项目 6. 随机森林节点重要性怎么算的(再次不会) 7. 讲一个算法 8. 想做什么(偏业务数据分析还是模型算法) 9. 喜欢什么课 10. 业务场景题 11. 秋招有什么offer 大概就
字节跳动提前批:data-电商 数据科学 一面,部门成员:~50min 1. 自我介绍 2. 机器学习 a) XGBoost:损失函数推导、特征重要性的计算方法 b) 为什么用SHAP计算特征重要性,不用XGBoost自带的方法(实习项目) 3. AB test a) 对于不同类型的指标,分别要怎么做统计检验 b) 用非参数方法检验偏态分布的指标,统计功效较低,有什么其他方法
暑假在北京字节实习没留在组内转正,想转到深圳就发起跨部门转正 一面(50min) 9.19 介绍和深挖实习期间的产出,全是业务相关问题 二面(50min) 10.10 1.介绍和深挖实习期间产出 2.计算策略的roi 3.常用的app(答的b站) 4.app不好用的点(答的b站推荐页的“你可能错过的视频”) 5.让你优化应该怎么做 6.反问 1.如果察觉多个策略间可能存在互相干涉有什么简单的分析方
时间线:8.26一面——9.10二面——9.26三面—— 9.29三面——10月底意向 一面 简历部分 ①实习项目---建议如何来的 答:从结论某个数字出发,来提炼项目的介绍思路 场景题 ①淘宝加历史价格曲线的功能,如何用abtest衡量是否上线? 答:abtest,指标体系,大致流程 ②接上gmv之外的核心指标? ③接上如何量化用户的价格敏感度? 答:回答思路是用个人和大盘指标比,指标定义为用户
### 一面技术面 自我介绍 四道算法 前两题是sql,其中一个难点的就是求连续登录2天以上的用户 一道快排 一道求二叉树是否是对称二叉树,就是左右节点是对称的 问实习经历(问的很细) 工作中的难点 维度建模过程 聊到数据仓库工具箱这本书的内容,我都不会。。。 数据倾斜(我从原理,场景,解决方案三个角度回答的) 问到一些常用函数,UDF,UDAF,UDTF概念 hive的概述 hadoop,hiv
TimeLine:一面20220826,二面20220902,三面20220915,HR面20220920,意向20221017 BG:北邮本硕,管理类专业,两段实习经历:字节数据分析师、美团商业分析师 写在前面的话:字节秋招走的是跨部门转正,并非官网投递。以下问题并未完全记录当时的回答内容,敬请读者谅解 一面 1. 如果用户的人均使用时长下降,怎么分析? ①明确分析指标: 人均使用时长 = 总使