已经入职一个多月了,才想起来写篇面经,有些面试细节记得不太清楚了,大家仅供参考。总体来说面试体验挺好,问的问题也没有很刁钻(可能是急缺人手),废话不多说直接上干货 一面 1. 自我介绍 2. 项目介绍-主要关于我在美团实习做的项目,AB实验,如何确保用户画像相似,观察的核心指标等等 3. t检验和z检验 4. p值的意义 5. sql:求用户留存 6. 逻辑回归背后的核心原理 7. 随即森林和xg
8.26 50min左右 首先自我介绍,然后问了许多项目的问题 然后问了mr的原理和运行流程 hive如何确定reduce的数量 Spark和mr的区别 数仓分层 数仓维度建模问题 什么是维度表和事实表 数据库的三范式 做题 首先是一个sql题,很简单,但是我只刷了大量的java题不会sql的呜呜呜以后一定多刷 然后写了一个归并排序 面试官人超好,特别有耐心 上天保佑让我一面过吧! #快手面试
2022.10.14 10min 感觉自己被kpi了... 三个面试官 一个hr + 两个技术(其中一个全程在工作 没有看过摄像头) 1.自我介绍 2.你用过hadoop 说一下hadoop各组件干嘛用的 3.实时项目处理了多少数据 另一个技术没有问题 HR: 1.工作地点填写的全国怎么考虑的 2.应聘期望薪资 (看offershow给的挺低的,就随便报了个10k) 3.反问 哎 虽然面试很轻松
一面: 主要还是挖简历 自我介绍 问项目经历,聊聊过往开发的项目(聊了很久) 聊聊MySQL的事务 细聊ACID 隔离级别 innodb默认级别 innodb的底层数据存储 对比mysql和hive kafka为什么吞吐量大 场景题目:100个G的文件,保存用户id和看的bookid,求top10阅读量的书 反问
一面:80min 1、自我介绍 2、介绍部门情况 3、介绍下部门的数仓建设情况 4、简述实习里的三个实习做的项目,聊背后的逻辑 聊了好久好久 5、聊聊在字节认为部门最厉害的技术是什么 6、聊聊自己的爱好 7、觉得自己有什么有优点 8、团队协作和个人工作区别是什么,各自的优点和缺点 9、一道sql题,有两个数组,展开数据,角标相对应的取出数据 10、sql的job和stage划分,窗口函数是否会sh
一面: 无自我介绍环节,直接开问 1、聊实习项目,很细,聊了好久 2、yarn任务提交流程 3、spark的stage切分原理 4、spark任务提交流程 5、对比mr和spark,为什么都用spark 6、谈谈对hudi的理解 7、kafka的负载均衡原理 8、两道算法题,字符串相关的 9、反问 ps.好多过程不记得了 二面: 三个模块 开发 大数据 算法 不想回忆了,直接自闭,一点都不会 但是
9.11 一面 35min: 1.自我介绍 2.专业介绍 3.Mysql索引 4.Mysql事务并发导致的问题 5.Mysql两种引擎的对比 6.Hadoop运行模式 7.job tracker 作用 8.Hdfs小文件问题 9.Hadoop调度器 10.Hadoop脑裂出现的原因 11.Kafka 怎样保证不丢数据 12.Flink task和subtask 的区别 13.并行度和slot的关系
我记得我没有投递过这个部门,但是约的面试是数据开发部门。 面试官很好,是我这两周最好的面试官了。 1.自我介绍 2.实习具体工作 3.觉得实习工作有哪些价值 4.自己认为自己有哪些比别人强的优势 5.http/https区别,端口是否可修改 6.get/post区别 7.mysql为什么使用b+树索引 8.秋招目标 反问。 面试官直接告诉我 京东基本没有C++技术栈,90%是java 所以感觉大概
到店业务 有点久远一直忘了写,就记得这么多 一面: 1、自我介绍 2、比赛中遇到的难点 3、实习中做的项目,聊项目细节 (大部分时间都在问这个) 我好像很多面经都这么简略的写,这次写细点儿哈,里面涉及到的一些知识点,具体项目就不聊了 数仓模型设计方法 数据质量如何判断 如何保障下游查出时间 对于重要程度不同的任务如何合理分配资源 dwd层建模方法,考虑哪些东西 spark任务调参逻辑和常用参数 c
关键数据结构和相关函数分析 对于第一个问题的出现,在于实验二中有关内存的数据结构和相关操作都是直接针对实际存在的资源--物理内存空间的管理,没有从一般应用程序对内存的“需求”考虑,即需要有相关的数据结构和操作来体现一般应用程序对虚拟内存的“需求”。一般应用程序的对虚拟内存的“需求”与物理内存空间的“供给”没有直接的对应关系,ucore是通过page fault异常处理来间接完成这二者之间的衔接。
一面 09.05 1h多 1.自我介绍 2.实习内容 3.指标建设与数仓的对应关系 4.指标怎么管理的 5.指标报警怎么设置 6.你会怎么管理所有指标体系 7.手撕 重复字符串 二面 09.07 接近2h 1.自我介绍 2.数理知识:拉格朗日函数、贝叶斯函数的损失函数,对缺失值的影响,卡方与t与z检验的区别 3.大数据相关:mapreduce中map task与reduce task个数、hive
从今年暑期实习开始直到秋招一共五次面试,转了四个部门,记录一下 实习篇 # IEG一面4.6 自我介绍 项目用的是什么计算方案,技术组件有用到云服务吗 讲一讲你在项目中遇到的问题 项目中计算内存不足调yarn内存,为什么不是spark内存 能讲一讲spark的相关概念吗(讲了基本架构,说任务提交流程太紧张没说完) 面试官提醒讲RDD的容错机制 小表join大表怎么优化的 多小可以叫做小表 数仓当中
秋招篇 # PCG 8.24 一面 秋招并没有投腾讯,是直接被捞起来面的 自我介绍 讲实习内容 讲实习当中做的最好的工作 面试官总结了一下我刚才讲的(好像觉得做的不够难。。) 介绍spark RDD spark程序里面不写action算子,程序会执行吗(肯定的答会。。) 数据倾斜有哪几种 mysql数据库索引有哪些 数据库事务介绍 平常mysql用的多吗 有了解过doris、clickhouse这
一段大厂数开实习 感觉面试官比较喜欢有数据中台经验的 项目基本没怎么深挖 重点问了数据源的接入&处理 sql题 算科目最高分学生 java题 返回有序数组中第一次出现指定数字的位置 要求复杂度最低 #数据人的面试交流地#