26届Java选手,面了很多大厂后端实习基本都挂了,稀里糊涂接了大数据的实习,总体比较顺利,先去沉淀了 9.27 美团数开一面 30min 介绍一个项目 项目中的难点 sql 求每月最大和最少的订单数量 二分查找 面完10分钟打电话约二面 9.30 美团数开二面 50min 介绍两个项目 MySQL 索引 介绍一下Hadoop HDFS有几个个副本,为什么 深挖Shuffle原理 sql 面试官自
12.17 中午投递 12.17 晚上面试 12.18 OC 上来面试官说节省时间就不进行自我介绍了直接做了四道题,做完四道题问了业务总线矩阵是什么 第一道:求员工绩效最高的三个月(可以并列)。就是聚合加开窗 rank 函数的运用 第二道:求最近一日留存率,两种解法 第三题:忘了是啥了但是难度也不大 第四道:下面的代码输出是什么几行几列都是什么,and 换成 where 输出是什么 select
自我介绍 实习中你遇到过哪些困难?是如何解决的? 能否分享一下你在数据分析方面的工作经验和心得体会? 你对这个岗位的理解是什么? 介绍一下你在跨部门沟通方面的经验 为什么不在上一家公司继续干? #非技术面试记录#
面试官问了一个sql的问题:一个书籍表、一个标签表、一个书籍和标签对应的表,如何查询每本书对应的标签,然后我说到可以sql的时候将每本书籍聚合,但具体怎么聚合说不出来,只会说通过简单sql查询后,通过拿到的的数据进行处理,根据标签id、书籍id继续发起查询后填充数据,返回给前端。 事后想破头都想不明白怎么在sql层面聚合标签,结果一问gpt才知道如果要在sql层面就将每本书籍的tag聚合,需要用一
timeline 10.24(周四)一面 10.28(周一)二面,当天约当天面 11.1(周五) 约三面,半小时后通知取消,官网流程结束 11.21(周四) 原地复活约三面 11.22(周五) 上午三面,下午oc 11.26(周二) offer邮件 #我的实习求职记录# #数开# #数开# #百度#
一面 数据仓库认识 维度建模之外还有哪些建模,有什么区别 项目中数据仓库分了哪几层,为什么要分层 Hadoop架构,你这些组件中选一个最熟悉的说(这问题也太友好了,我选了MapReduce,说了一下流程) 怎么实现分区,环形缓冲区溢写的分区和后续Reduce的分区一样吗 环形缓冲区里的快排是怎么实现的,是对数据快排吗 简述了一下快排的过程,时间空间复杂度 时间复杂度和空间复杂度的区别,原理,怎么计
写论文写的心烦,得找个人来骂一下,今天吐槽的是一家游戏厂,柠檬微趣 柠檬微趣(数仓)-一面,面完秒挂 1.数据结构基础:数组,链表,队列,栈 2. 1 趣味题:公司里1/2是系统开发,2/5是软件开发,1/4是两个都干,请问都不干的人占多少 2.2 趣味题:公交车30min内到站的概率是80%,请问其在10min内到站的概率是多少 2.3 趣味题:有25匹马,五条赛道,每匹马每场比赛速度都一样,但
约面试的上午和我说晚上面试官在高铁上,改面试时间到第二天下午 数据仓库的介绍,项目的数仓怎么设计的 数仓分层问题,每一层的数据流向。会从ods层取数据吗,什么时候会向dws层取数据,什么时候会从dwd层取数据。新业务来了数仓怎么扩展 业务总线矩阵横纵坐标代表什么,维度冗余情况介绍 ER模型和维度模型优缺点 什么是业务过程,什么是粒度。(我简单说了一下,也举了个例子说明。但是让我用抽象的定义语言来阐
小米(汽车数据研发)-一面(行为面) 1. 问问简历(不深入) 2. 是否有组织过学校活动 3. 如何解决与同事之间的冲突 4. 如果负责的项目与其他部门的利益发生冲突如何解决 5. 如何解决分配的工作超出自己能力范围 6. 自己的职业规划 7. 学习前沿技术的方法 8. 自己的优缺点 9. 如何看待普遍的加班现象 * 然后挂掉了
感觉有一部分原因是急招,所以过的很顺利。因为经常在牛客看经验贴,所以也写个小面经回馈下社会吧。顺便捞个实习搭子,base闵行工区。 tl: - 上周五被hr从人才库里捞出来了,约面运营岗 - 周一个人觉得该运营岗不符合求职规划,致电取消约面,顺便被转推荐到数科岗 - 周二一面,1小时后告知通过 - 周三二面,半小时后告知通过 - 周四hr面,傍晚oc - 周五offer 面试: - 一面:两道与实
数据开发日常实习的一面,也是我的第一面。投简历的时候没想到会这么快,上午投的简历,晚上就打电话约第二天面试,自己完全没准备好,以为会有一个礼拜左右缓冲时间。和hr约了第三天面。首面还是非常紧张,问的问题很多都回答不上来,表现很差。后续一个礼拜没有联系,应该是g了 自我介绍,介绍一下项目以及项目中用到的一些大数据组件 HDFS的文件存储格式有哪些(这个真没想起来) MapReduce过程,MapTa
美团 (数据开发)-一面 1.算法:归并链表 2.编程语言:可变类型与不可变类型,tuple设计出来的作用是什么,深拷贝浅拷贝,闭包,继承与多态,面向对象与面向过程,Python内存管理机制 3.算法:归并排序,选择排序,冒泡排序,快速排序的过程,时间,空间复杂度,快排能只用o1的空间复杂度吗,二叉树,二叉查找树,二叉线索树,b树,查找复杂度,树的遍历,栈和队列,如何简单实现 4.数据开发:spa
#软件开发笔面经# 说是数仓开发,但其实面试更多偏向于408基础,八股居多 1、TCP协议 和 Http协议的区别? Http 和 Https 的区别? 2、TCP/IP网络模型有哪几层 3、TCP和UDP的区别? 4、TCP的四次挥手可以变为三次吗? 5、Cookie 和 Session 的区别? 6、GET 和 POST 的区别 7、什么是聚簇索引? MySQL事务是怎么实现的? 8、进程
#百度开奖# bg计算机专业双非硕,最近拿到了百度的实习offer,有不少人私信我问经验,索性就开一个双非实习攻略系列吧!🎉 ⭐我将分享我是如何从零开始,一步步敲开大厂实习的大门的。这只是序章,大概介绍一下会讲哪些方面,更多干货和细节,由于篇幅原因我会在未来的帖子中一一展开,敬请期待! 🎯【确定方向】 首先,要尽早确定自己的职业方向。作为双非的我,曾经也迷茫过到底是选java还是跟着实验室做算
滴滴 (数据开发)-一面 1. Spark的shuffle和MR的shuffle的区别 2. 数据倾斜的处理方法 3. 数据倾斜的定位方法,(sparkwebUI里看stage的执行时间) 4. spark语句的解析方法 5. spark的命令执行过程 6. sql:最大连续登陆用户个数 滴滴(数据开发)-二面 1. 数仓的星型模型雪花模型 2. 数仓的分层架构 3. 场景题,库存快照表的需求如何