# 一面9.8 自我介绍 离线项目用到什么架构 实习使用的是什么开发语言 实习做的是哪一层的开发 阿里数仓分层是怎么做的 Mysql的索引是用的什么 为什么用B+树索引 一条语句select from where group by having在mysql中执行顺序是什么 mapreduce的执行过程 hive分区表和分桶表的区别 数据倾斜有哪些是怎么处理的 给题说思路 1. 统计主键出现次数 2
是脉脉这个公司的面试,不是脉脉上投的公司的面试。 虽然没想去,但我感觉也没资格去 面试官一直在说不做评价,不做评价,懂我意思吧。 问了java、jvm、scala偏函数 大数据问了kafka选举流程;yarn调度器;zk。哪不熟问哪,反其道而行。 偏底层组件开发,我可能偏数仓吧,技术力还没到这个程度。问的有点怀疑人生 面试官结束直接告诉我今天到这了,我说问问题呢问问题,他说理论上实习生没有提问环节
二面和一面很类似,完全不问八股文,也不让我sql,算法。 问实习经历,我说我在的部门偏业务,天天就是写sql,还有就是理解业务。 项目中的难点,感觉哪一块收获比较大,回答:刚刚的前一个月sql还有点难度,后面主要是对业务的理解。有不会的问题一定要敢问,不怕别人觉得自己是菜鸡,自己本来就是菜鸡,收获是增强了自己的沟通能力。 问了我对大数据组件相关的理解,就那些东西,hadoop,hive,spark
8.19上午十点和十二点,两次面试间隔一个小时左右,面试时长都不超过30min,面完没消息,大概率凉了。 一面: 介绍一下离线数仓项目? 说说你理解的数仓? 数仓为什么要分层? mapreduce和spark的区别 怎么理解指标? 两个相对简单的sql题 二面: 介绍一下简历中你比较熟悉的一个项目 分主题的目的是什么? 为什么使用HBase存储维度表,怎么考虑的? HBase原理了解吗,和其他数据
零售数据部门,看到帖子说态度很差,吓得我慌的一批 结果是个姐姐,态度很好 详细问了简历、项目、实习经历,对沟通过程、难点、技术点进行了深挖 数仓问了几个八股,不重要 然后就是什么性格、抗压能力、职业规划之类的 我反正周周面,面麻了,面试好不代表能进,爱咋咋地,巴不得地球爆炸
最喜欢的一种面试方式,全程问实习和项目。 1.自我介绍+技术栈介绍+实习介绍+难点介绍(第一次做了十多分钟的自我介绍) 2.你的难点为什么不用oltp引擎解决呢,应该多拓展一下oltp的宽度(针对oltp讨论了快⑩分钟) 3.bitmap详细讨论 4.用户怎么使用你们的数据产品 5.实时了解吗 6.base地只考虑武汉还是都可以 许愿hr面 #数据人的面试交流地#
1. 维度建模和范式建模是什么,两者之间比较大的区别。 2. 为什么说维度建模可以故意引入数据冗余,而范式建模要避免数据冗余,它们这样做的目的是什么? 3. 两道Sql题。 order_info ( order_id bigint, -- 订单id city_name string, -- 城市名 driver_id bigint, -- 司机id passenger_id bigint, --
1. 自我介绍 2. 讲解一下项目 3. 项目中数仓为什么要这样分层。 4. 关于数模比赛项目的问题。xxx 5. 写sql题。 用户访问日志:user_id, device_id, date 求1. 给定时间2024-06-17 用户、设备的数量,都有重复值,都有可能为空 第一次写法: select count(distinct user_id) user_cnt count(distinct
26届Java选手,面了很多大厂后端实习基本都挂了,稀里糊涂接了大数据的实习,总体比较顺利,先去沉淀了 9.27 美团数开一面 30min 介绍一个项目 项目中的难点 sql 求每月最大和最少的订单数量 二分查找 面完10分钟打电话约二面 9.30 美团数开二面 50min 介绍两个项目 MySQL 索引 介绍一下Hadoop HDFS有几个个副本,为什么 深挖Shuffle原理 sql 面试官自
马上入职一个月了 记录一下面经~ 一面:(50min) 1.自我介绍 2.介绍实习项目 3.实习过程中遇到了问题是怎么排查的? 4.介绍一下你自己写的项目 5.讲一下java内存模型 6.scala和java有什么区别?说一下你的理解 7.手撕代码:两道sql,一个算法,算法是反转链表 8.你对数据仓库了解多少?对大数据了解多少? 反问: 1.评价 2.部门技术栈 #美团##美团25届转正实习##
写这篇帖子就是为了回馈广大牛友。 美团一志愿投的后端开发,没人捞流程自动结束,二志愿开启后迅速约面。 Timeline 3.29一面 4.3二面 4.8 offer 因为人在海外,hr打不通电话,因此直接就发offer到邮箱了。 面经 这里就写几个在众多面试中比较让我印象深刻的问题吧。 1. 对于一个电影,怎么设计数据库中的表,怎么加索引?如果用户搜索很复杂,比如可能任何字段都想搜到电影相关信息,
一面: 1.拷打项目 2.拷打实习 3.sql top n 面试官应该不是数仓的,应该是偏向平台开发那边,所以没问八股 二面(5.13) 已OC
#软件开发2024笔面经# 1说说你对数仓里分层的理解,越详细越好? 2说说你对数仓里数据建模的认知理解,越详细越好? 3之前做过数仓么? 4请简要说明什么是数据仓库,以及它与数据库的主要区别。 5列举几种常见的数据抽取、转换和加载(ETL)工具,并简述其特点。 6如何处理数据中的缺失值?请举例说明至少两种方法。 7讲一讲你对分布式数据处理框架(如 Hadoop、Spark 等)的理解。 8在大数
笔试 90min 选择题+sql*1+算法*2 简单sql,困难算法 一面 共 50min 自我介绍 sql 3小问 15min 实习经历 项目经历 数仓分层的意义 从hdfs如何到ODS层 介绍维度表和事实表 有没有使用zookeeper hadoop节点之间如何进行联系 hive sql脚本是在哪里运行 一共有多少张表,都是自己写的吗 做数仓的时候遇到了哪些困难,怎么解决的 在实习期间的困难和
1.自我介绍 2.介绍项目,数据哪来的,数据量级,数仓模型,曝光率怎么算的 3.难点介绍,随spark版本变化会不会有一些函数不适用 4.bitmap的JAVA实现,哈希冲突怎么做的 5.数据倾斜介绍 6.除了数据倾斜,还有哪些优化手段 7.开窗函数 8.udf用过吗 9.JAVA实现过什么项目 10.sql:去掉一个最高分去掉一个最低分求用户平均分 很常规的一次面试,没什么好细说的 #数据人的面