二面和一面很类似,完全不问八股文,也不让我sql,算法。 问实习经历,我说我在的部门偏业务,天天就是写sql,还有就是理解业务。 项目中的难点,感觉哪一块收获比较大,回答:刚刚的前一个月sql还有点难度,后面主要是对业务的理解。有不会的问题一定要敢问,不怕别人觉得自己是菜鸡,自己本来就是菜鸡,收获是增强了自己的沟通能力。 问了我对大数据组件相关的理解,就那些东西,hadoop,hive,spark
8.19上午十点和十二点,两次面试间隔一个小时左右,面试时长都不超过30min,面完没消息,大概率凉了。 一面: 介绍一下离线数仓项目? 说说你理解的数仓? 数仓为什么要分层? mapreduce和spark的区别 怎么理解指标? 两个相对简单的sql题 二面: 介绍一下简历中你比较熟悉的一个项目 分主题的目的是什么? 为什么使用HBase存储维度表,怎么考虑的? HBase原理了解吗,和其他数据
零售数据部门,看到帖子说态度很差,吓得我慌的一批 结果是个姐姐,态度很好 详细问了简历、项目、实习经历,对沟通过程、难点、技术点进行了深挖 数仓问了几个八股,不重要 然后就是什么性格、抗压能力、职业规划之类的 我反正周周面,面麻了,面试好不代表能进,爱咋咋地,巴不得地球爆炸
最喜欢的一种面试方式,全程问实习和项目。 1.自我介绍+技术栈介绍+实习介绍+难点介绍(第一次做了十多分钟的自我介绍) 2.你的难点为什么不用oltp引擎解决呢,应该多拓展一下oltp的宽度(针对oltp讨论了快⑩分钟) 3.bitmap详细讨论 4.用户怎么使用你们的数据产品 5.实时了解吗 6.base地只考虑武汉还是都可以 许愿hr面 #数据人的面试交流地#
1. 维度建模和范式建模是什么,两者之间比较大的区别。 2. 为什么说维度建模可以故意引入数据冗余,而范式建模要避免数据冗余,它们这样做的目的是什么? 3. 两道Sql题。 order_info ( order_id bigint, -- 订单id city_name string, -- 城市名 driver_id bigint, -- 司机id passenger_id bigint, --
1. 自我介绍 2. 讲解一下项目 3. 项目中数仓为什么要这样分层。 4. 关于数模比赛项目的问题。xxx 5. 写sql题。 用户访问日志:user_id, device_id, date 求1. 给定时间2024-06-17 用户、设备的数量,都有重复值,都有可能为空 第一次写法: select count(distinct user_id) user_cnt count(distinct
#软件开发2024笔面经# 1说说你对数仓里分层的理解,越详细越好? 2说说你对数仓里数据建模的认知理解,越详细越好? 3之前做过数仓么? 4请简要说明什么是数据仓库,以及它与数据库的主要区别。 5列举几种常见的数据抽取、转换和加载(ETL)工具,并简述其特点。 6如何处理数据中的缺失值?请举例说明至少两种方法。 7讲一讲你对分布式数据处理框架(如 Hadoop、Spark 等)的理解。 8在大数
1.自我介绍 2.介绍项目,数据哪来的,数据量级,数仓模型,曝光率怎么算的 3.难点介绍,随spark版本变化会不会有一些函数不适用 4.bitmap的JAVA实现,哈希冲突怎么做的 5.数据倾斜介绍 6.除了数据倾斜,还有哪些优化手段 7.开窗函数 8.udf用过吗 9.JAVA实现过什么项目 10.sql:去掉一个最高分去掉一个最低分求用户平均分 很常规的一次面试,没什么好细说的 #数据人的面
1、 目前研究的项目,对数据的处理? 2、 你怎么理解数据挖掘? 3、 平时用啥数据库? 4、 3NF? 5、 深剖数仓项目 6、 讲一讲项目? 7、 数仓表哪里用到了3NF? 8、 是2NF吗? 9、 数仓模型? 10、 事实表和维度表都有啥? 11、 下单业务中怎么记录下单了但未支付的行为? 12、 拉链表用过吗? 13、 留存率怎么实现的? 14、 连续的还是间隔的? 15、 今天算出来的留
来美团不知不觉快一个月了。想和大家分享一些干货,包括我的美团面经,希望对大家有所帮助。 base:双非本+211硕 💼 公司岗位:大数据开发实习生 🕒 时间线: 4.6美团校招官网投递 4.13美团笔试 4.15美团一面(挂) 4.29美团复活赛一面 5.8美团复活赛二面 5.13美团oc 笔试总结:我是菜鸡。一共四个算法题,做出来两个,有一个超时,有一个测试用例都没过。美团的话笔试难度不是特
一面:30min 自我介绍 实习和项目内容 数仓常问的分层、维度建模等 八股,基本是按照简历问的 Spark和MR区别和优劣? Spark的Shuffle和MR的Shuffle的区别? Standalone模式是怎么调度资源的,Yarn模式有什么变化? Kafka消息投递保证机制?有出过问题吗?怎么解决? 介绍一下HBase?优缺点?使用场景? LSM数和B+树区别? SQL题: 同时在线最多人数
腾讯会议面试 1.自我介绍 2.你对于测试开发的理解?为什么选择测试开发? 3.你最满意的一件事。 4.对大疆有什么了解 常用语言的考察 5.python给自己打几分 6.python字典怎么合并?dict.update() 7.python列表怎么反转?列表名.reverse() 8.python里面有指针吗? 9.python迭代器?生成器? 反问
荣耀:录用决策中 概况:投递的是大数据开发岗,整体面试流程较快,面试官考虑我本科商科背景也没有特别为难,更多是考察我对于一些大数据技术的基础认知。 一面: 1. 主要会什么语言?用过什么库?讲下自己使用机器学习算法做的一个项目? 2. 讲讲Hadoop的构成?遇到过数据倾斜问题没有?产生原因,以及解决方案?
测评:行测题,难度简单—中等 线下群面:2个面试官,一位hr,一位技术面试官 1、自我介绍 2、给一个场景题,附带两个问题,35分钟,小组讨论,选两位总结 题目和智能汽车有关,涉及优点和劣势 (1)讨论智能汽车的影响 (2)说说智能汽车潜在的风险,并列出解决方案 3、技术面试官提问 (1)数据开发:说一下事实表和维度表? (2)其他岗位:忘了 4、hr提问 怎么评价自己在小组讨论里的表现? 群面凉
一面: 全程围绕简历展开问 1、自我介绍 2、聊聊印象最深刻的一次竞赛经历 (简历写了) 针对这个竞赛内容抠细节 3、问实习经历中做的事情 挑了其中几个细问 这个答了好久,从事情的背景,到思考链路 4、一道算法题 一个数组先升序再降序,求最大值 5、hadoop数据的存储格式 6、spark里job、stage、task的概念 7、问flink、hudi这个有没有经验 因为简历上写了,回答说学习的