7.15一面: 1.自我介绍 2.项目深挖(聊了很久) 3.对数仓的看法 4.主题域及其建设过程(要落地,谈业务过程) 5.讲一个熟悉的指标体系构建(没做过) 6.为什么不考研 7.为什么想跳槽 8.sql留存率(讲了下思路就行了) 反问: 1.为啥晚上6点还面试,唯品会不是955吗 2.唯品会的计算引擎选型是什么 ------------------------- 挂了
没想到实习的第一面给了团子,记录一下: 1.面试官上来直接介绍业务:美团金融,负责借贷、理赔的,对这个挺感兴趣 2.发散:说说大数据和计算机专业的区别 3.谈谈对chatgpt的理解 4.介绍一下自己的项目背景(尚硅谷电商离线数仓) 5.两阶段聚合是怎么解决数据倾斜的 6.拉链表如何解决维度缓慢变化 7.数仓的分层结构 8.数仓的建模流程 9.如果产品给了一个用目前技术无法解决的问题,该怎么办?
1.自我介绍 2.实习中需求方向源自于哪里,最终交付哪些东西 3.数据倾斜展开聊聊,数据倾斜的本质,热点数据处理 4.bitmap原理和运用场景 5.零点漂移怎么解决 6.常见的维度建模模型和方法 7.java的垃圾回收机制 8.关系型数据库介绍一下,和数据仓库的区别 9.MySQL索引 10.数仓分层介绍一下,分层的好处 11.spark宽窄依赖,算子举例 12.手撕:java二分查找,sql窗
1.问本科经历,对大数据的接触 2.问项目是否是真实项目或者实习项目,,不是demo 3.项目介绍,毕设项目讲了15分钟 4.where和having区别(having能单用) 5.Spark宽窄依赖 6.leftrightinnerjoin 7.sql写题,统计所有月销售额超过1w的员工 8.反问,ABtesting--是否是埋点-PVUV-灰度策略的流程
一面:3.14 1.首先问实习经历,简单说了下是做数据处理跟分析,然后又简单问了一下实验室项目,没有深入问 2.Java的数据结构有哪些 3.聊一下数组这种数据结构,各种操作的时空复杂度,arraylist的扩容。 4.有哪几种树? 5.详细介绍一下b树跟b+树,b+数查询时间复杂度,为什么? 6.b+数有哪些商业用途(答了MySQL索引) 7.增删改比较多的情况下,为什么一段时间后要重新建立索引
时间线: 5.10一面 —— 5.14约二面 —— 5.17二面 —— 5.25直接发offer 无hr面,无oc 美团一面 1.项目 1)项目的总体架构和实现? 2)Flulme 和 Sqoop 如何保证数据不丢失? 3)数仓中的主题是什么,是根据什么来确定的? 4)数仓分层的优点和缺点 5)星座模型 6)数仓分层,每一层的作用? 7)事实表和维度表有什么关系? 8)事实表有哪些类型? 9)除了
2022/06/15 一面 35min 1:介绍项目 2:数仓分为几层?每一层作用? 3:数仓分层的意义? 4:flume导入数据到HDFS 为什么中间加kafka? 5:项目中可视化用什么做的? 6:SQL题 一列为日期 一列为金额 按月统计金额总和 7:MapRedcue原理 8:MapReduce的三个阶段 9:研究生上的课 10:接触过实时的大数据业务吗? 反问:部门技术栈 ?实习的话
二面被面试官吊锤。问到了不熟悉的平时没太注意的细节。比如,utf-8能不能存emoj。当时有点忘记是utf-8的一个变种能存了,说了utf-8能存。百度基本问算法,算法设计这些,八股(指计网,操作系统等),大数据框架基本没问。项目也问的少。
整理了一下提前批的面试 项目: 项目介绍一下 数仓建模,设计的每一层的作用?数据量有多大? Hive怎么创建分区表?项目有用到动态分区吗?用到过二级分区吗? 了解Hive调优吗?分区裁剪了解吗? HDFS写数据流程 一台DataNode宕机怎么处理 HQL语句的执行过程,验证用户权限在哪个组件?语法检查、表结构是否存在的检查在哪个组件? 对哪个大数据组件熟悉? HBase LSM树的思想说一下 M
1、实习的工作内容是什么? 2、有写过UDF吗?如何实现UDF? 3、UDF要成为永久函数怎么做?如果不加temperory,函数下次还能用吗? 4、UDTF了解吗? 5、Hive的窗口函数有了解过吗? 6、开窗函数Over()中有没有orderby有什么区别? 7、汇总数据开发是怎么做的?(实习工作) 8、Flink任务的并行度和内存怎么设置的? 9、Flink的TaskManager内存模型了
2023春招找实习的同学跟我分享了他的面试经历,在这里我进行了一些总结梳理,然后发出来供大家学习 1.自我介绍 2.八股文 你写的这个实时数仓,维表是怎么更新的 flink了解吧,flink里面断流怎么处理 flink的exactly-once是怎么实现的 checkpoint的时候barrier什么时候发送 checkpoint产生了很多快照,怎么进行处理呢 sparkstreaming和str
#牛客解忧铺##牛客在线求职答疑中心##你觉得今年春招回暖了吗##面经##大数据开发# 附加信息:211本+985硕(非计算机),笔试4出头的分数,面了90分钟,面试官人超好,奈何本人过菜 1、部门介绍 2、自我介绍 3、项目介绍,在项目中承担什么角色,如何完成工作 大数据相关: 4、对大数据开发的理解 5、知道什么常用的大数据开发组件 6、谈谈MapReduce的原理 7、谈谈shuffle的实
1. 自我介绍 2. 要不要读博 3. 上一段实习经历中最困难的是啥/最不舒服的是啥/怎么解决得困难 4. 有女朋友吗?在哪里 5. 家在哪里?未来想在哪里工作?父母什么看法。 6. 投阿里没有,为什么不去阿里(感觉答得稀烂|我说投了被拒了) 7. 目前在进行中的应聘有哪几家,会选择去哪家 8. 啥时候能来实习?实习到啥时候 反问: 包住宿吗? 多久出结果?我有啥可以提高的
1. 自我介绍(问的项目的场景是干嘛的,解释 GStreamer)——20min 2. std::bind、原子变量、std::packaged_task、std::move ——10min 3. 100万亿找 top100、二叉树层序遍历 ——10min 4. 算法:手写线程池、无限背包 ps: 表示面试官人很好,还给我的垃圾找了理由。体验很好,下次还来
1. 自我介绍(问的项目的场景是干嘛的)——20min 2. 算法题(二叉树自底向上层序遍历(A了)、数组中找到重复的数(要求不用额外空间、O(N)的复杂度)(不符合要求,不会)) —— 30min 3. C++程序崩了怎么查(gdb、手动注释) 4. CPU 满了怎么定位线程(gdb、perf、火焰图) 5. C++八股(static啥用处) 6. 啥时候能来(下个月中旬) 7. 反问(我来了能