面经 自我介绍(没准备,即兴说的,在校期间的事) 介绍数仓项目 flume 的原理 sqoop和 datax 的区别,如何访问 MySQL sql 的开窗函数,行列转换 mr 的执行流程,经历几次排序 反问 数据量多大 数据源是 hive,处理引擎是 spark 大概做什么的 面试半小时
1.自我介绍 2.两道SQL 3.mapreduce中map阶段和reduce阶段的task的数量怎么确定 4.了解哪些建模方式,了解维度建模吗,说说他们的区别 5.rdd有哪些shuffle类算子 6.shuffle的本质是什么 7.为什么数仓要分层,分层的意义在哪 8.四个排序的区别 9.spark的提交流程 10.hive中的元数据存储了哪些内容 已过
投递平台:某boss,之前不知道滴滴开秋储实习招聘,简历被转移到数据分析反作弊岗位上了。 6月8号晚九点多收到面试邀请,可以自己在9号选面试时间段,我选了9号下午四点40的时间段。 一面:4点40开始 面试官是一个很温柔的小姐姐,面试过程很开心。 问题如下: 1、自我介绍 2、实习经历介绍与实习经历深挖,讲述自己在实习过程中印象深刻的一件事。(楼主有一段游戏公司数据分析的经历) 3、询问项目 4、
1. 自我介绍 教育经历+实习经历+项目经历+与岗位的契合程度+技能水平 2. 在之前的实习经历中要和哪些部门对接?要对接多少人? 3. 设想在出行的场景中,每天会通过城市、产品线的维度来监控完单量、交易额、收入额。假设某地区的单量减少了40%,怎么分析这个问题? 面试官提示:滴滴出行是一个相对特殊的互联网平台,并非纯线上的场景,考虑问题时需要考虑实际情况——为什么要出行?什么时候
面了差不多有四十分钟 ①首先问了下项目flume 和 kafka相关,由于很久没复习这两个组件,回答的不好 ②说一下HDFS读写原理 ③JVM内存区域介绍一下 ④有哪些垃圾回收器,你就说CMS就行了,他的基本原理以及优缺点,其中四个阶段哪些阶段需要stop the world ⑤Java对象内存是如何分配的,有哪些分配方法? ⑥分配对象的过程中会出现并发问题吗,JVM是如何解决的? ⑦有用过JVM
面试官全程微笑,体验感极好。 上来大佬先来了个礼貌式微笑。 然后自我介绍。问了问我的研究方向(多模态) 聊了聊大数据相关的技术? 如果来大数据部门想做什么? 问了一下我做的数据挖掘的比赛? 然后30min一道题。 二叉树的z字遍历和阻塞队列二选一 问了一下时间复杂度和空间复杂度。 反问环节: 部门培养人的计划是什么? 您是做什么的? 整体感觉很流畅,体验很好,期待过 ps:滴滴23秋储 一共几面?
6.30一面 面试官很nice 1专业相关 为什么要跨专业考研 具体的专业在实际中的应用 2 问了个简单的sql 写错了 面试官一步步提醒终于写出来了 3 口述用栈 实现计算器功能 7.1 二面 1 简单sql 2 数仓理论 3 数据倾斜处理 滴滴面试官都是很有耐心 一步步提示你 解决问题 就算面不过体验也很不错。 7.11收到offer了
问了一点ts,后面主要内容还是面向对象,设计模式,数据库相关,还问到了redis。当然很多我都不会,所以面试官也没啥好继续深入的了。 最后了解到因为团队是要用node去操作数据库的,所以需要掌握这些知识,像数据库不能是简单了解,得是真正像后端那样学会数据库。不然不懂的话这块造成的损失应该还是蛮大的。 所以我应该是凉了,下去看看面向对象,设计模式这些,数据库内容不少,估计没时间看了。
面试记录 3.18易车-数据分析一面 1、自我介绍 紧张,回答的很磕巴 2、研究方向是什么 机器学习在生物信息领域方面的应用 3、讲一种你熟悉的算法 项目用到的梯度下降法 4、参数怎么设定 项目相关 5、想做算法方向还是业务的分析?为什么 业务方面,原因没有回答好 6、你有什么问题吗? 我问面试官最看重求职者的什么能力?回答说觉得我做数据分析有点浪费,应该做数据挖掘方向。 结果:加了微信,通过了简
一面 8.11 1.介绍上一份实习工作内容 2.介绍一个项目,背景 过程 产出 3.与业务沟通的流程是怎样的,指标如何定义的,看板如何设计的 4.再做一遍的话可以如何改进 5.除了刚才的项目,还有其他的产出吗?你是怎么说服其他人用你的这个产品的? 6.SQL去重的几种方式?(答到了1.窗口函数用 主键+倒序时间戳row_number=1去重 2.distinct 3.union 4.final,但
问问有没有大佬们大数据开发的实习经历啊,我怎么感觉隔着天天写sql 老是遇到这种实习岗,一天全面试完,急招岗, 没什么参考价值,应该oc了,因为我不想立马去,发of要排序吧 一面(9.6 上午 50min) 1.自我介绍 2.问实习经历问了很久 3..五道sql题 4.数仓理论 二面(9.6 晚上 1小时) 1.自我介绍 2.问实习经历 3.sql题 4.mapreduce的流程及其shuffle
面麻了 大概率凉 团队是数据中台(?其实没听清) 主要做的工作是实验方法/评估的改进及推广 岗位是数据分析 但是更偏向数据科学 但是对于AB实验要求很高 要了解因果推断 AB实验/统计学基础/业务思维缺一不可(没有手写sql) 1. 自我介绍 2. 介绍一段经历 有追问 会直接点出问题 反思:对于实习的经历不仅要非常熟悉且知道问题在哪/有无改善空间 有一点比较好玩 lz这段经历给n个面试官讲过
一面(12-26 30min) 自我介绍 3道sql题(主要考察hive sql的基本语法,开窗,常见函数这种) 数仓分层讲一下 项目中有遇到数据倾斜吗,怎么解决的 hive列转行函数了解吗 反问:对数据仓库未来湖仓一体的架构怎么看, 部门职责, 工作时间 二面(12-30 20min) 开场先聊了会天,面试官很健谈。 sql语句,口述运行结果 在做这个项目的过程中遇到的最大的挑战是什么? 聊了下
bg:一段数分实习+中台运营 一面(25min): 1.自我介绍 2.简历中提到用过XGB模型,介绍一下:特征选了什么,最后的重要因素是什么(结合落地性),准确率多少 复盘:下次介绍的时候可以先明确自变量和因变量分别是什么,当时以为自己star法则说的还挺清楚的,结果输出一通之后,面试官的第一个问题就是x和y是什么...... 3.case题:目前滴滴在上线阶段,如何做好用户回流,有什么分析思路
凭我仅剩不多的印象写一下~ 一面 #数据人的面试交流地# 1.常规自我介绍 2.sql题:两个表 (1)求最后一次登陆时间 (2)求该年最大连续登陆天数 3.业务相关 (1)异常数据如何分析 (2)在没有拼车业务的国家开展拼车业务,目前有各城市快车业务的数据和公共数据(例如可以查到的城市人口等),如何确定最合适的两个城市来开展拼车业务? (3)你认为开展拼车业务对这个国家的乘客、司机以及我们平台有