没想到实习的第一面给了团子,记录一下: 1.面试官上来直接介绍业务:美团金融,负责借贷、理赔的,对这个挺感兴趣 2.发散:说说大数据和计算机专业的区别 3.谈谈对chatgpt的理解 4.介绍一下自己的项目背景(尚硅谷电商离线数仓) 5.两阶段聚合是怎么解决数据倾斜的 6.拉链表如何解决维度缓慢变化 7.数仓的分层结构 8.数仓的建模流程 9.如果产品给了一个用目前技术无法解决的问题,该怎么办?
时间线: 5.10一面 —— 5.14约二面 —— 5.17二面 —— 5.25直接发offer 无hr面,无oc 美团一面 1.项目 1)项目的总体架构和实现? 2)Flulme 和 Sqoop 如何保证数据不丢失? 3)数仓中的主题是什么,是根据什么来确定的? 4)数仓分层的优点和缺点 5)星座模型 6)数仓分层,每一层的作用? 7)事实表和维度表有什么关系? 8)事实表有哪些类型? 9)除了
2022/06/15 一面 35min 1:介绍项目 2:数仓分为几层?每一层作用? 3:数仓分层的意义? 4:flume导入数据到HDFS 为什么中间加kafka? 5:项目中可视化用什么做的? 6:SQL题 一列为日期 一列为金额 按月统计金额总和 7:MapRedcue原理 8:MapReduce的三个阶段 9:研究生上的课 10:接触过实时的大数据业务吗? 反问:部门技术栈 ?实习的话
二面被面试官吊锤。问到了不熟悉的平时没太注意的细节。比如,utf-8能不能存emoj。当时有点忘记是utf-8的一个变种能存了,说了utf-8能存。百度基本问算法,算法设计这些,八股(指计网,操作系统等),大数据框架基本没问。项目也问的少。
整理了一下提前批的面试 项目: 项目介绍一下 数仓建模,设计的每一层的作用?数据量有多大? Hive怎么创建分区表?项目有用到动态分区吗?用到过二级分区吗? 了解Hive调优吗?分区裁剪了解吗? HDFS写数据流程 一台DataNode宕机怎么处理 HQL语句的执行过程,验证用户权限在哪个组件?语法检查、表结构是否存在的检查在哪个组件? 对哪个大数据组件熟悉? HBase LSM树的思想说一下 M
1、实习的工作内容是什么? 2、有写过UDF吗?如何实现UDF? 3、UDF要成为永久函数怎么做?如果不加temperory,函数下次还能用吗? 4、UDTF了解吗? 5、Hive的窗口函数有了解过吗? 6、开窗函数Over()中有没有orderby有什么区别? 7、汇总数据开发是怎么做的?(实习工作) 8、Flink任务的并行度和内存怎么设置的? 9、Flink的TaskManager内存模型了
昨天hr面完就oc了,今天签了录用函,整体来说速度还是非常快的。 一面(11.25): 主要是问的暑期实习中的工作,涉及到 数仓的分层建设 主要参与建设的数据域及需求细节 数据模型的设计 数据治理等 基本上是围绕着这几个方面深挖。 二面(12.02): 实习期间负责的数据的应用场景有哪些? 项目细节 如何看待这个岗位,你觉得它在企业中的职能是什么、价值体现在哪些方面? 你觉得这个岗位未来的发展趋势
自我介绍 new String() == "" new Integer(100) == 100 说一说集合List和Map java中的锁 写一个双重锁单例模式 mysql 几种锁,怎么设计一个联合索引 多线程的实现方式,区别 SpringBoot 用过哪些注解,怎么定义一个接口 手撕单链表排序(写过但是忘干净了,寄) 总结:偏后端,寄就寄吧#数据开发##数据开发工程师面经##好未来面经#
时长46分钟 这个约面还挺神奇的,毕竟我压根没投过字节,不知道以前听谁说的字节面试先甩出几道hard所以当时找暑期就没投这个😂hr打电话说是实习面试,但是由于秋招马上开了所以面完说能在秋招的流程里少一些轮数的面试,推的快一些 1.没有自我介绍,直接拷打实习,我先讲了我的智能npc相关的,然后讲了我数据构建、筛选、优化相关的工作,感觉他不太认可😂直接从细微处拷打,让我讲了我们组里总体的优化过程,
1. hadoop如何实习高可用 2. 实习的需求(异步io) 3. 进程和线程的区别,通信方式有何不同,在开发过程中,需要注意的地方? 4. 物理地址空间和逻辑地址空间 5. 两道算法题,一道二分,另一道是改进之后的二分
1.自我介绍 2.项目 3.实习优化工作 4.强化学习原理 5.sql和java/python的区别 6.写题 统计每个年级,最高分数学生 7.numpy\pandas有没有一种可变机制的修改(没听过,真没听过) 8.对于RDD不可变的理解 9.对谓词和谓词下推的理解
思特奇一面 19min(已进终面)总体来说不难,但是网上风评不太好 1. 自我介绍 2. 介绍一下你在实习中用到最多,掌握最好的技术? 3. 介绍一下你项目中,从数据采集,到数据加工到标签生成,整个流程能介绍一下吗? 4. 标签用什么语言开发?能简单介绍一下hive吗?hive的分区?hive表能单条删数据吗? 5. 你能说一下hive sql的性能优化吗?参数+代码 6. 说一下你的比赛内容?你
24届秋招 一面电话面 自我介绍 介绍实习工作 数据倾斜怎么解决 map join 原理 维度缓慢变化了解吗 二面视频面 介绍实习 实习工作具体内容 口述SQL题 了解哪些数据治理 数据仓库迁移介绍下 过了几天HR面 OC
1. 自我介绍、讲一下项目 2. 手撕:最长无重复字符子串的长度(hot100 3. 数据库为什么要有索引 4. 从写好的代码 到运行出结果 这中间发生了什么(编译链接执行?还有啥 5. cpp智能指针的用途、底层实现 6. TCP与UDP协议的区别 7. 25匹马 5条赛道 如何快速选出最快的5匹马 全程约40min
1. 自我介绍,问项目 2. 什么是线程安全,如何保证线程安全 3. 什么时候要建索引,为什么要建索引 4. 用过key-val数据库吗,redis的使用场景 5. 用过哪些设计模式 6. 代码题:leecode213