12.17 中午投递 12.17 晚上面试 12.18 OC 上来面试官说节省时间就不进行自我介绍了直接做了四道题,做完四道题问了业务总线矩阵是什么 第一道:求员工绩效最高的三个月(可以并列)。就是聚合加开窗 rank 函数的运用 第二道:求最近一日留存率,两种解法 第三题:忘了是啥了但是难度也不大 第四道:下面的代码输出是什么几行几列都是什么,and 换成 where 输出是什么 select
约面试的上午和我说晚上面试官在高铁上,改面试时间到第二天下午 数据仓库的介绍,项目的数仓怎么设计的 数仓分层问题,每一层的数据流向。会从ods层取数据吗,什么时候会向dws层取数据,什么时候会从dwd层取数据。新业务来了数仓怎么扩展 业务总线矩阵横纵坐标代表什么,维度冗余情况介绍 ER模型和维度模型优缺点 什么是业务过程,什么是粒度。(我简单说了一下,也举了个例子说明。但是让我用抽象的定义语言来阐
9.27二面总计45分钟左右 1.自我介绍 2.实习经历介绍 3.项目介绍 4.逐一拷打简历上的各个方面,首先是实习,实习内容,实习产出,实习收获,问到实习期间做的工作时会深入问项目细节(数仓分层情况,项目数据情况等) 5.实习拷打的差不多了问了个专业名词:数据血缘,没听说过,随便胡诌了一点ods层和dw层关系溯源的情况,面试官说意思差不多,然后给我讲了一下这个名词 6.拷打项目,从项目数据源到数
刚刚笔试4道题只过了两道半,感觉悬了,第二题dp死活只有50%准确率,用dfs又超时了,当时一紧张完全忘了还能加memoization,唉,就是下面这道题,第二题挣扎了1个多小时导致第四题一点没碰,最后交卷前看了一眼好像不太难,亏死了 你来到了一个迷宫,迷宫共有 n 关,每关有左侧和右侧两个宝箱,左侧宝箱的收益为 a_i,右侧宝箱的收益为 c_i。 在每次只可以选择一个宝箱,然后到达下一关。 当你
1.驼峰转换 标志位判断是否下一位字母是否大写 2.判断素数 类型为long,只判断奇数,偶数直接返回 3.将长度为 n 的数组分成 m 个非空子数组,使得每个子数组的最大公约数 的和最大 dp[i][j] 表示前 i 个元素分成 j 个子数组的最大 GCD 和 更新前要递归计算gcd 4.每个套餐春夏秋冬的平均评分,三张表 临时表:先关联套餐表和互动表,用if判断月份来打标tag .计算coun
面试官比较看细节,遇到不确定的会反复让你确定 1.自我介绍 2.问项目和实习 3.项目架构 4.如何确保kafka的消息不重复读(答了offset和ack机制,但是ack记成消费者的ack了,估计寄) 5.kafka的主题 分区 分块的概念 6.flink的checkpoint机制 7.手撕 二叉树非递归遍历 8.Java中线程安全的集合有哪些 9.线程不安全的例子,能举几个吗 10.反问 总结:
数据开发岗位,第一批次 题型:选择题10道,算法题3道,sql题一道 作答情况:算法题:1.5 sql题:1 1、 一看题目吓一跳,写的跟小作文一样,,,最长上升子序列和字典序,不过仔细看了下不是很难,做出来了 2、字符串权值,又是小作文。不会做,和同门讨论了下好像只看第一位就可以? 3、0-n 中取m位数,找出大于k的个数,50% 4、sql题,计算总销售额,平均销售额,不算很难 #携程校招笔试
40min 1. 自我介绍 2. 用户行为漏斗分析,从ods层开始全链路步骤,埋点如何设计,应该关注哪些触发的动作 采集到ods层的数据什么样的,有哪些字段 dwd层设计了哪些事实表 dim维度又有哪些表 dws层汇总聚合了哪些表与用户行为漏斗有关,这些表怎么设计的 最后ads层漏斗分析怎么做,如何可视化 3. 手撕sql 连续7天登录 4. 反问
【一面--业务面+技术面】 评估某城市活动增量价值(1. 自身时序预测 2. 找相似城市) 针对上一个问题,问到自身的时序数据没有满一个周期怎么办(找相似产品补趋势,那怎么找相似呢--可以基于特征相似) 算法实习生和数据科学实习生的区别 说一下你的项目,半监督算法是怎么做的,贝叶斯搜索是怎么应用于这个项目的 老板需求和业务ddl有时间冲突咋办(考情商的应该) lightgbm和gbdt的区别,ba
化身程孝子,直接开摆,推掉所有面试 Timeline 3.05 投 3.13笔 3.27一面 3.28 二面 4.3三面(HR)4.7英语测评 4.9 oc 4.16 offer #携程2025实习#
1、一上来面试官问我是否了解自己投的岗位,说感觉我的项目经历与所投岗位并不是十分融合 2、聊一聊数据湖 3、数据湖的数据怎么存储? 4、考察SQL 三个问题 步步变难 而且全程面试官口述题目 5、left join和inner join的区别 6、count(*)和count(列名)的区别? 7、对建模的东西了解多吗,懂不懂星型模型 了解星型建模星型 8、星型建模的核心基点是什么? 9、星型建模和
1.自我介绍 2.对实习展开问:(提及主要做了ods 和ads ,基本就展开ods 问) 实习项目整体是怎样的? 主要做ods层,那涉及到什么数据? 用什么工具? 线上数据能否支持删除(物理删除,逻辑删除)? DataX在同步过程的局限性在哪,在数据同步有没有遇到什么问题? 如何保障线上数据与数仓一致(即如果线上数据删除的话,数仓同步过的数据如何保证一致)?(后续有提及数据质量监控)? ods做了
1 . 自我介绍 2.面试官,你们有教过大数据技术吗?应该没教过吧? 2.spark为什么比MapReduce快 3.spark算子链 4.问项目 5.Sql调优 6数据倾斜 6.一道sql题,思路,之前笔试做过,但只过了2/3 7.有接触过flink实时计算框架吗? 8.MySQL索引是越多越好吗?索引类型?什么时候用聚簇索引,什么时候用非聚簇索引 9.反问。 面试官挺好的,是我太菜了,一些没答
携程求好运 接好运,给我来个hr面吧
火车票业务 有点久远一直忘了写,就记得这么多 一面: 1、自我介绍 2、聊实习,扣细节 3、聊实习项目技术难点,聊到了我用later view遇到的坑,面试官直接激动,并表示他前几天也碰到了这个坑,两边都很惊喜,直接惺惺相惜 4、聊竞赛经历,内容以及遇到的难点 5、开始八股,写吐了,这里就省略了,要看的看我之前的帖子 6、sql题,是啥忘了,难度中等吧 7、反问 二面 主管面: 1、自我介绍 2、