时间线:09.06笔试,09.16一面,09.21二面,09.22三面,09.26收到感谢信 一面:业务 30min 深挖实习经历 面试官比较注重是否了解目标值以及项目整体的了解情况,而不是具体的执行细节 有问指标体系搭建和增长目标制定的问题 二面:hr 30min 1. 经营分析的理解 2. 如何看待“扬长避短” 3. 从经营分析的角度评价实习部门的业务情况 4. 职业规划 三
本人双非本科毕业,感觉自己也不是什么技术大佬,勉强过得去,留下一篇面经,为后来人提供参考啦。 恒生秋招分两面,一面技术面,一面技术综合素质面。 一面: 首先进去之后自我介绍,讲一下自己的的个人特点,然后问了问自己对于这个岗位的了解,为什么选择这个岗位,所以大家一定要提前了解所投岗位的定位特点,我有个同学就是这样,然后就很遗憾被面试官刷了。然后问了问几个简单的数据库相关的技术,真的不难,很简单,但是
上来先做了一道 最近登录日期 的sql题 然后开始问大数据八股,,,, 1. mapreduce map端的shuffle过程 2. spark stage 划分的依据 3. 宽依赖和窄依赖 4. 了解kafka吗 5. spark sql与mysql sql的区别 6. spark dataframe 和dataset的区别 7. 数据库中id设计 除了uuid和时间戳,还有什么方式 #招银网络
发现网上百度数分的面经真的好少,决定把自己的面经和大家分享一下,希望有所帮助~ 面试的问题都比较经典,准备其他数分岗位的同学也可以参考! 9.27 一面 35分钟 介绍面试流程 自我介绍 逻辑问题: 1. AB产品利润都上升,但总利润下降,请分析可能的原因?(辛普森悖论的应用,流量分割的问题) 2. 预估北京市网约车司机的数量 (拆解出分析逻辑比较重要) 业务问题: 1. 结合业务的概率题(考
一面 1h20min 0824 由于过去时间太久了,差不多都忘记了,只能回忆起部分。 部门是CTO线-技术与产品部,当时只有1个校招hc和1个社招hc 1. 写题:一个文件系统,有文件夹有文件,需要找到某个特定的文件(好像是这样)递归后要求用BFS写,然后BFS写了一遍; 2. SQL题:题目有些复杂,现在想不起来了,约等于leetcode hard难度的sql题目,用开窗和几个select即可;
时隔4个月 又来牛客求offer了 发面经攒人品 速速来oc timeline:8.29投递-9.2笔试-9.8一面-9.19二面-9.27hr面 2023.02.08 update 泡死啦 现在都没消息!!! 一面 28min 自我介绍 三段实习经历每一段提问一个项目并深入提问 sql 机器学习 反问 二面 25min 自我介绍 然后感觉不知道问啥 随便问了两个问题 就开始反问 这时候才十分钟吧
一面 40min 0906 没有任何八股,全程讨论抖音数仓架构。重点于日常业务与架构优化。 二面 30min 0915 没有任何八股,全程围绕一个问题展开:数仓未来出路。答较烂,最后答案大约是脱离数仓的固有边界,向上走往业务靠拢 吐槽一下这个答案。在一般的大厂,如果划定了公共层与应用两个组,那做公共层是不能也没法向业务方对接的,因为业务方是去找应用同学承接业务。如果公共层数仓同学去接业务,不仅没有
一面 40min 0914 没有问任何八股,主要还是围绕抖音的数仓建设、架构优化、日常业务展开。 关于为什么不具体写数仓建设与架构优化方案,一来是每个公司并不相同,没有可参考性,拿最简单的分层,每个公司的分层都不一样,所以没有在面经中展开这些相关信息。二来这本身属于公司内部信息,没法在平台上展开讲。 #数据仓库与数据分析实习##秋招##秋招面经##2023秋招#
一面 40min 0919 不记得问了什么,大致好像是围绕目前的实习展开。 二面 40min 0920 努力回忆一下,问了一些八股 1. 为什么划分宽窄依赖? 2. Checkpoint和Persist? 3. MR过程? 4. 为什么Spark比Hive快?(这其实不合理,一个计算引擎和一个数仓工具,没法比较,面试官应该想问的是Spark和Hive的默认MR引擎吧,然后按照这个方向回答的) 5.
一面 30min 仍然记不得了,努力回忆一下 实习数据有多大? 这么大的数据量需要多少资源? 多线程的三要素? Java的内存模型? 宽窄依赖? Spark为什么快? Spark的Shuffle有几种? (不记得了 二面 20min 用ES或者HBase跟用Hive有什么区别? 怎么技术选型? 总结:是吉利下面的子部门,主做出行方面数据,数据量较小,且人员较少。 #数据仓库与数据分析实习##秋招#
背景:本硕中上985,本科数学专业,硕士计算机,投递岗位总行数据开发岗位,有两段算法实习,自己跟着CMU做过一个数据库项目,目前还在做一个TInyKV,代码能力一般。 9.30 笔试 笔试内容包括 - 行测 - 基础知识: 1. 大数据开发相关,spark,hive,hadoop等内容,因为没有做过相关工作,基本靠猜 2. 计算机
2022.10.10 一面 1h TDL优化推动存在什么问题? 所有的下游修改代码由公共层实现是合理的吗?如果不合理有什么解决方法? 目前整个数仓多少任务?(母鸡 目前数仓分几层?你觉得目前分层中的平衡应该怎么做到或者有什么思考? SQL题:一个tb表,里面有姓名,课程分数,课程名称,目标:取最高课程分数的学生名字。我的答案用了join,然后提问:join的优化有哪些? Java题:反转字符串,用
#迅雷#数据分析师 #笔试 1.hivesql条件判定语句 2.房间里有产品经理和开发人员,2人离开,1人是产品经理。求房间里开发人员的概率 3.一个部门,五分之二为数据开发,五分之二为数据分析,都从事的有四分之一,求都不从事的人员概率 4.推送会员卡折扣给长期未使用用户,其目的是(营收,流失,用户找回,拉升新增) 5.mapreduce如何解决数据倾斜 count,join,大小表,grou
10.10 一面 12min 明明写的数据开发,招的是数据挖掘..... 全问的算法,一个大数据的东西都没问 满满的槽点,邮件上写的面试时间20min,然后一直等,然后hr说是上一个人还没面完.....再怎么没面完也不会让人等超过20min吧,结果等了半个多小时.......还是3个专业面试官,面试就12min,明明写的是大数据开发岗,说我怎么经历都是数据开发......招的又是数据挖掘,直接单开
笔试(10.11) 岗位是数据开发,一道编程,几十道选择。难度不大,但涉及面挺广。 一面(10.15) 笔试完,隔天约面,效率很高。 项目介绍,自己的分工 特征选择方法 数据挖掘中对于缺失值的处理方案 说一下Python(pandas)中常用的数据处理算子。 Spark的原理,分布式是怎么搭建的。 Sql中union和union all的区别 数据行转列怎么操作 xgboost和gbdt的区别 x