阿里云数据开发一面,问项目穿插八股,本帖就只记录一下八股部分 1.三范式是什么 2.Spark RDD和DataFrame的区别 3.Spark涉及shuffle的具体算子 4.MySQL存储引擎是什么 5.MySQL存储的结构是什么,为什么不能用特别长的key 6.使用过哪些大数据框架 7SQL的窗口函数,什么作用,具体例子 8.了解过云计算吗 9.springboot会用吗
面试官迟到7分钟左右 进来了之后表示抱歉,因为上一个面试的人超了时间。告诉我本次面试大概20分钟,准备好了可以开始自我介绍了,注意把控好时间 其实这里我就已经觉得兴致不高了,所以回答的没有很用力 1.自我介绍 2.你知道这个岗位是做什么的吗?(我按照JD加自己理解说了几点 3.我们这个岗可能更偏数据分析处理一点,你觉得你能做吗 4.在学校有自己训练过模型吗 5.能给我介绍下是怎么训练的吗 6.如果
👥 面试题目 1. 字符串串池复用判断题 String str1 = "abc"; String str2 = new String"abc"; String str3 = "abc"; 2. try catch finally的作用;finally一定会执行吗? 3. Exception &error的区别 unchecked
#软件开发2024笔面经# 二战字节 一面 自我介绍 介绍实习工作 平时做什么 数据量多大 数据仓库理解 怎么分层的 Spark执行流程 Spark内存划分 SQL优化方式 布隆过滤器 JVM内存模型 垃圾回收 双亲委派 SQL题 连续登录 算法题 LRU 二面 自我介绍 介绍实习 数仓为什么分层 主要解决什么问题 两道算法题 链表删除元素 和 在数组中快速查询数据 布隆过滤器 半连接查询 gro
一面 实习做什么 介绍实习的项目 对大数据的开发 数据仓库的认识 为什么数据仓库分层 Spark SQL题 分组TOPN 算法题 二面 介绍实习 Spark底层 Stage怎么划分 宽窄依赖 口述SQL语句转Spark RDD 代码算法题 SQL题 留存率 三面 介绍实习 介绍这个学校的项目(开始问算法。。) 用的哪些算法 为啥这样用 概率论相关 三门问题 三门问题进阶 扔硬币,先扔的人胜率 面了
24届秋招 一面电话面 自我介绍 介绍实习工作 数据倾斜怎么解决 map join 原理 维度缓慢变化了解吗 二面视频面 介绍实习 实习工作具体内容 口述SQL题 了解哪些数据治理 数据仓库迁移介绍下 过了几天HR面 OC
1.自我介绍 2.实习 关注准确性和效率等指标的权衡 3.项目 4.sql全勤员工 两天没消息了忍不住打电话问了,hr接起来电话来第一句“你是浙大同学吧,我们交叉面隔壁部门面试官忙” ????浙大去网易干外包做数开?????我是不能理解
公司:太平洋保险 岗位:数据分析 机考:就是行测加性格测试 面试: 一面: 1.上来给你一张A4纸,根据自己的情况让你画画 然后轮流根据图画进行自我结束 2.无领导小组讨论,当时不同组讨论主题都不同 二面: 1.自我介绍 2.了解太平洋吗(当时直接说的不太了解,说完感觉就寄了) 3.不是本地人,为什么考虑留在这,为什么不去江浙沪 4.考研了吗 考的哪 还问了和复试线差多少 5.问了简历里数模国赛国
40min 1. 自我介绍 2. 用户行为漏斗分析,从ods层开始全链路步骤,埋点如何设计,应该关注哪些触发的动作 采集到ods层的数据什么样的,有哪些字段 dwd层设计了哪些事实表 dim维度又有哪些表 dws层汇总聚合了哪些表与用户行为漏斗有关,这些表怎么设计的 最后ads层漏斗分析怎么做,如何可视化 3. 手撕sql 连续7天登录 4. 反问
面试时间30min,无手撕: 1.首先做了自我介绍和项目介绍 2.如何开发的数仓项目,照着复制粘贴还是自主开发 3.单一全量表,还是有增量表 4.如何进行的维度建模 5.项目中dws层的作用 6.如何做的数据同步,数据传输 7.业务数据库和数仓ods层有什么不一致 8.对于一直增加,并且一直变化的订单,应该使用全量表还是增量表 9.为什么使用增量表 10.要查询某一个订单的详情,但是不知道日期,如
b站数据仓库实习一面面经(约一个小时) 1 自我介绍,包含了自己的项目介绍 2 项目中对你比较有挑战和困难的点是什么 3 问了一下实习公司的主要业务线有哪些 4 问了一下项目是公司的项目还是自己独立开发的 5 在公司负责的主要工作是什么 6 抽一个对你印象比较深的项目讲一讲(引申出来了下面三个问题) 7 数据探查会做的工作有哪些 8 验数的工作主要做了哪些 9 产品和业务沟通不够导致的指标不一致,
一面: 1.拷打项目 2.拷打实习 3.sql top n 面试官应该不是数仓的,应该是偏向平台开发那边,所以没问八股 二面(5.13) 已OC
数据分析师 周六晚上面试,面试官自我介绍 1.介绍下自己 2.在哪上学,可以保证一定出勤率吗 3.sql两道题 4.连接 几个连接的区别 5.union all 与union什么区别 6.上述两个的区别 7.面试官问几个offer目前(我说两个 并让我讲一下对offer公司已经自己实习的期待) 8.如何提升自己? 反问环节? 我:对我进行一个评价或建议 面:能力还可以 很有上进心 我:对实习生的期
占个坑先,谢谢面经攒人品。 前两次面鹅都挺难绷的,一点大数据没问 第一次光子测开不知道怎捞了我,人生第一面,估计是我一开始就问为啥捞我到测开?就随便问了点,速度面完秒挂 0.自我介绍,项目(估计不相干,所以讲完就过了) 平常如何自我提升技能 1.session和cookies的区别 2.get和post的区别 2.5元组和列表的区别 3.讲讲数据库的索引 4.什么时候用索引什么时候不用 5.进程和
#软件开发2024笔面经# 1说说你对数仓里分层的理解,越详细越好? 2说说你对数仓里数据建模的认知理解,越详细越好? 3之前做过数仓么? 4请简要说明什么是数据仓库,以及它与数据库的主要区别。 5列举几种常见的数据抽取、转换和加载(ETL)工具,并简述其特点。 6如何处理数据中的缺失值?请举例说明至少两种方法。 7讲一讲你对分布式数据处理框架(如 Hadoop、Spark 等)的理解。 8在大数