大数据开发暑期实习总结 这篇文章总结了美团近30篇面经的题目,想着大家可能也需要答案,于是我根据自己的理解以及网上的一些答案进行了梳理,如果有不对的地方,大家可以评论区留言讨论哦(别喷我~~~) Java 写一个多线程代码 class RunnableDemo implements Runnable { private String threadName; public Runn
详细介绍竞赛和项目,数模题目和思路。面试官对我的竞赛比较感兴趣,问了很多细节。 手撕:力扣179. 最大数。面试官将题目发到聊天里,自己粘贴到本地 idea,核心代码模式,自己写测试用例,说思路,不用提交到力扣。 大数据 + Java 八股:Spark、Flink、Kafka、GC、JUC 等。问一个技术你熟悉多少,然后自己阐述,中间面试官会根据你说的提出一些具体的问题。 结果:hr 马上通知一面
数据库 索引,B+Tree MySQL架构。Server层、存储引擎层分别干啥? 一条查询语句执行流程? 一条update语句执行流程? 两阶段提交? redo log、binlog 分别保存在哪一层?什么位置?(不会) 事务隔离级别? with nolock 在哪个隔离级别?(不会) 复盘 问的都是数据库的一些东西。一面过,二面不面了
1.离职原因、离职时间点 2.上一份工作所在的部门、小组、小组人员数、小组内的分工 3.个人负责的目标,具体是哪方面的成本 4.为了降低专员成本,做了哪些方面的工作 偏向于机制、分析方法、思维,当下主要是对于部分高收入专员收入不合理的情况进行分析,可能是作弊、单价等,怎么去识别,识别到之后怎么去处理 (1)高收入人群识别(2)拆分高收入原因(3)线下排查这种是否正常 5.针对怎么识别高收入原因,怎
感觉没有什么参考价值 像kpi面 # 滴滴一面 45min 介绍最有意思的一门课 我说了因果推断 然后他就开始问我因果推断 介绍IV 为啥工具变量可以识别因果关系 介绍PSM 为啥psm可以识别因果关系 实习经历介绍 你构建的指标有帮你发现什么问题然后做出实质性的改变吗 平常打车吗(我说我用高德…) 高德有什么优缺点 如果高德北京gmv下降了5%,怎么分析
1h 肯定挂的一面…… 4.26更新: 已g,又被其他部门捞了明天面试(哎………) 还是基础不牢固🥹 1. 简历问题 20min 2. 两个场景题: (1)给具体业务如何设计表 (2)具体场景怎么解决数据倾斜的问题(摔 真的想不到用union sum代替join) 3. 写题 哎 反正到最后已经心凉了,只想赶紧结束面试🥹 #阿里# #数据研发#
1.上来就是三个题 (1)sql:给出一个学生信息表,求出每个班级人数占全年级人数的比例; (2)hive sql:A表10亿条数据,B表10万条数据,都含有 uid 和 name 两个字段 1)求出A表与B表uid的差(A表中有,B表中没有); 2)求出B表中的所有uid。 (3)有list1= [2, 4 , 7], list2 = [3, 6, 9],都是升序排列,将其合并成一个新的升序链表
大家好,我是乐乐,我是一个23fall的校招生,上岸后来回馈社会啦~ 这次分享的是我面试“字节跳动-Data-数据分析-抖音/剪映/电商/直播”的第二轮面试面经和经验,供后续的同学们参考呀,具体面经看图片哦~,更多信息资料可看xhs,同名可关注哦~ 面试总结 1. 难度:⭐⭐⭐⭐⭐ - 感受:说实话我有被紧张到,面试结束的那天晚上没有睡好,因为自己是有可能被挂的。 - 评价:从整体上看,这次面试是
前言 从2023年3月初开始投递暑期实习,几乎所有大厂都投递过了,有些简历都过不了,有些一面直接挂了,虽然说确实互联网行情不是特别的好,但是应该还是自己能力不足,做的简历不够漂亮; 4月的时候第一次刷到了@三石数据的面经帖(见下图),于是跟他聊了一下,真的收获太多了,非常非常感谢这位大佬的指导,不仅帮助我修改简历,而且还给我解答一些在面试中遇到的问题;大佬要是没女朋友的话,我愿意以身相许(开个玩笑
一面 0322 46min 接触的大数据技术栈都有什么? Spark和MapReduce之间的关系是什么? Spark中的DAG是怎么生成的?是DGAScheduler生成的DAG Spark-submit之后有什么过程? 从提交sql到解析,这是谁完成的?是Driver还是Application? Driver端什么情况会OOM? Executor端什么情况会OOM? 你觉得Spark和Flin
😅 #软件开发2023笔面经# 当时是在Boss直骗上投的简历,绝了。写的实习,每天200-400数据分析师,可远程实习,简历筛选过了晚上给我打电话说明天上午十一点面试,还告诉了我主要会考察哪些内容:sql是核心考察的(当天晚上又把尘封许久的sql拿出来敲了敲,问了一下条件查询,分组查询),linux基础命令使用情况(当天晚上火急火燎去背linux命令),python能力(问了浅拷贝深拷贝的区别
美团一面凉。。 投了三个志愿,前俩没面试就挂。 然后 到店事业群-平台技术部 大数据开发工程师给面了,可能是看我有个大数据有关的项目吧,比较水。。部门主要做数据仓库、大数据开发工具、算法的。 spark原理,数据都是在内存吗 mapreduce shuffle hive了解吗 和mysql的区别 kafka生产者消费者原理 如何保证数据不丢失,怎么读以前的数据 问python了解不 sql 子查询
一面 4.23 当天下午约二面 (点错成周四4.27了摔😤 lz面过最长时间的面试,足足1h40min,10:15开始,结束都快12点了🥲也不知道是面试官工作比较闲还是lz太话唠了🤣 Part1: 实习经历 团子的面试官好像对我的实习经历非常感兴趣,一直在深挖,问得非常非常细,到具体什么指标、数据是多少这样子,这一part直接干了四五十分钟😳有记不得的lz就直接说记不得…但是面试官挺好滴,
笔试过了一个月给捞起来了 一面 45min 1. 自我介绍 2. 细聊项目,很细(一上来就忘了数据量,尴尬) 3. 特征工程怎么做的 4. iv值的计算方法 5. AUC的计算方法 6. 正反例不平衡对auc有影响吗 7. 知道过拟合吗 8. 逻辑回归怎么解决过拟合问题 9. 写个函数指针 10. pandas库有哪些数据类型 11. 怎么取两个dataframe有差异的部分(忘了具体函数了,讲了
# 一面60min - 自我介绍&实习经历 - 搜索电商gmv下降,如何分析? - 如何量化归因每个渠道对于搜索gmv的下降贡献(每个渠道体量不同的情况下) 面试官思路:构造一个统计量(忘了是啥)同时考虑品类的体量和变化值 - 用回归做归因合适吗? 面试官思路:不合适,因为有些爆品没有历史数据 abtest - 如何计算样本量 - 设计abtest判断入口很深的功能变动对于整体的订单取消率是否有影