9.11 一面 1.自我介绍 2.介绍实习内容 3.对数仓分层的了解 4.对ab实验的理解 5.对实时了解吗 6.logistic回归的损失函数 7.口述sql:简单窗口 8.反问 9.19约线下,调整成线上 9.26 二面 两个面试官 面试官1: 1.自我介绍 2.更想做数开的工作还是数科的工作 3.解释spark中的水印 4.对实时数仓的了解 5.spark数据倾斜怎么处理 6.设计一个bi产
前几天笔试,是一个类似投票的那么一个界面,面相txt编程,结果提交的时候,一直提交失败,后续联系hr说让我们发个word过去 今天面试 1.讲一下快排实现 2.问一个问题,假如你有1000w条数据,怎么在尽可能短的时间查出来,我说不会,他提醒我多线程,我就说将数据分为几部分,用多线程去查,然后他说怎么巴拉巴拉,我后面说这个场景题我接触的少不会,然后他说那你现在想一想,想了十几二十秒,他没说话我也没
9.4 一面 1. 介绍实习经历 2. 数据同步 3. 指标分层 4. flink:状态,历史数据回溯、一致性保障、barrier下发、开始做ck的时间点、反压、下游怎么知道上游反压了、解决 5. hbase问题:架构、数据读写、底层文件存储、region划分、regionserver划分(这是啥) 6. jvm内存管理,多线程 7. spark问题:宽窄依赖,算子,shuffle,调优 8. 数
字节跳动 - 数据研发 一面(40min) 学过的数据结构,并分别讲下它们的特点 进程和线程的区别 TCP和UDP的区别 JAVA的面向对象的三大特性,并详细介绍应用场景 MySQL的事务隔离级别 MySQL的binlog的运用 数据仓库的的特点、数据治理 范式建模、维度建模 Hive内外部表的使用场景 HQL底层执行逻辑 Hive数据存储在哪,分区和分桶的区别 Sort by 和 Order b
一面 9.24 面试时间:30min 自我介绍 实习介绍 数仓分层? ODS层怎么分区的?多久清理一次? DWD层做了那些工作? 数据清洗怎么搞的?清洗掉了那些字段?为啥要清洗这些?后面不会用吗?如果后面的指标需要用怎么办? 怎么脱敏的?UDF怎么用?除了UDF还有什么方式? 维度退化是怎么做的?为什么要这样做? 宽表都在那一层? 开窗函数用过那些?rank,dense_rank区别? lead,
一面(国庆前三四天吧) 面试官先介绍了下自己,以及funplus,和DBA的工作职责。 讲了下项目 问了下分布式锁 问了下我的项目redo log和undo log怎么实现的 面试官说我这边肯定会给你过的,接下来你问问我吧,有没有什么想了解的?剩下聊天,凑够半个小时。 二面 (2023.10.11) redu log和undo log的实现原理以及解决的问题? 说到日志,mysql中是每条语句都会
一面 spark数据倾斜 实习相关 二面 Sql 找出最长连续子序列(row_number) 算法 二叉树层序遍历 mapreduce运行过程 spark.shuffle.partitions的调参原理 Spark小文件参数 怎么确定reduce的数量 bucket join优化的原理 怎么快速根据spark stage找到对应的代码 主题域划分 事实表怎么建模 数仓建模过程 事务的特性 进程和线
09.04 笔试,测评 笔试代码题sql比较简单 09.08 一面 1.自我介绍 2.一道简单sql题目 3.python:冒泡排序(实际写的快排) 4.了解实时数仓吗? 5.对Hadoop框架的了解 6.对mapreduce的了解 7.反问 09.12 二面 十分钟左右 1.自我介绍 2.python中怎么实现类型转换 3.python常用的函数 4.研究生阶段的学习计划 5.反问 10.09
9.11 一面 35min: 1.自我介绍 2.专业介绍 3.Mysql索引 4.Mysql事务并发导致的问题 5.Mysql两种引擎的对比 6.Hadoop运行模式 7.job tracker 作用 8.Hdfs小文件问题 9.Hadoop调度器 10.Hadoop脑裂出现的原因 11.Kafka 怎样保证不丢数据 12.Flink task和subtask 的区别 13.并行度和slot的关系
一面 09.05 1h多 1.自我介绍 2.实习内容 3.指标建设与数仓的对应关系 4.指标怎么管理的 5.指标报警怎么设置 6.你会怎么管理所有指标体系 7.手撕 重复字符串 二面 09.07 接近2h 1.自我介绍 2.数理知识:拉格朗日函数、贝叶斯函数的损失函数,对缺失值的影响,卡方与t与z检验的区别 3.大数据相关:mapreduce中map task与reduce task个数、hive
1.自我介绍 2.实习期间怎样快速解决碰到的难题 3.分库分表之后怎么做关联查询 4.怎么处理冷数据和热数据 5.接口设计完后通常怎么测试 6.对电信和天翼云有什么了解 7.对云计算和数据库研发方面工作能否胜任 许愿~
实习产出表 (业务语义 业务场景 业务粒度 具体链路) hadoop体系 hive和hadoop关联 join 的mr详细过程 数据倾斜 如果只有几个键导致数据倾斜 数仓建模的意义 为什么要建数仓不直接用关系型数据库(olap oltp区别) 3nf 为什么实际建模不遵循3nf 分层 体验非常好 不过鼠鼠实习的时候考虑做的业务很建模理论关联太少 只是把表做出来 这部分太差了 虽然大概率寄 但是很有
timeline:9.20一面-9.21二面-9.27HR面-已offer 业务部门:到店事业群 感觉美团的面试官真的非常非常专业,而且会很积极地给一些反馈和建议,每一场面试下来都能学到很多!btw,看别的面经说HR面可能会比较偏行为面,但好像不是的,面我的HR小哥业务能力还挺强的。以及今年的面试流程好像比较短,不知道咋回事,等开奖吧。。。。。。 【一面】 1.商业分析业务价值是什么?能为业务提供
投递的数据存储岗位,问的基本上是操作系统和数据库,三面一下午面完,迷迷糊糊的记不太清了,就记住这么多。 华为一面 项目里 epoll 怎么实现的,和其他IO多路复用方法的区别 说说你的论文 数据库引擎数据结构(B+树、跳表)、操作系统引擎数据结构(红黑树) 数据库持久化怎么做的 项目中考虑数据库体量太大的问题了吗,怎么处理的。 事务的权限和脏读幻读,举例让我说这是什么情况 内核态和用户态的区别了解
信也科技 新客模型 一面: 问题: 1.自我介绍。 2.为啥选择偏业务的数据分析,而不是研发? 3.场景:用户表: id user_money ,假设id从0递增 user_monery 为用户借款数额 需求:新增一列用于,记录用户的欠款累计和。 pandas中DateFrame 和SQL分别如何实现。 4.特性选取方法? 5.PCA原理. 6.了解树模型吗? 一点 7.MoE? 不会 8.分类指