时间:一个小时 数据采集通道的搭建要用到什么能力 离线数仓项目几个人,后端做啥 datax和sqoop的区别(应用场景上的区别) maxwell的底层原理是啥 怎么理解mysql的主库和从库 主从延迟比较严重对数据的影响 数据量级,条数 在日志采集项目中有什么收获 这块是新开发的还是迭代的 现在数据采集已经封装很成熟了,那做数据采集对后面数仓开发有什么优势吗 hive中内部表和外部表怎么转换 多张
这次面试之前才换了一个新的项目 准备了很多关于项目的问题 但没咋问😅 自我介绍 + 项目介绍: 关于dubbo框架问了几个问题 为什么使用dubbo?(性能好, 提到了底层基于TCP协议) 为什么性能好?(答不出来) dubbo框架的工作流程了解吗?(简单讲了一下和注册中心相关的流程) 你是怎么学习dubbo框架的?(看文档) 如果你的同学要开始学习dubbo框架,你有什么可以教给他的?(叫他自
来美团不知不觉快一个月了。想和大家分享一些干货,包括我的美团面经,希望对大家有所帮助。 base:双非本+211硕 💼 公司岗位:大数据开发实习生 🕒 时间线: 4.6美团校招官网投递 4.13美团笔试 4.15美团一面(挂) 4.29美团复活赛一面 5.8美团复活赛二面 5.13美团oc 笔试总结:我是菜鸡。一共四个算法题,做出来两个,有一个超时,有一个测试用例都没过。美团的话笔试难度不是特
一面: 自我介绍 手撕: 力扣54 + 692 (30min) 八股(15min): 你对装箱和拆箱的理解? Object类方法有哪些? final关键字可以作用在哪里? 集合总体分类? 线程安全的集合? HashMap和hashtable区别? B+树 (八股可能忘记了一些...但都是常规八股) 项目(10min) 简历上两个项目各问了一点 反问(5min) 面试表现 具体业务 多长时间有结果
🕒 岗位/笔试时间 岗位:软件服务工程师(数据开发方向) 6月12日 19:00-20:00 📝 笔试题目 选择题:包括数据库,sql的一些相关知识 还有一道代码题,记不太清了 🤔 笔试感受 当时代码题写了一半,没完成,以为凉了,但是后续通知了一面 🕒 岗位/面试时间 6月18日 11:00(大概四十分钟) 👥 面试题目 自我介绍 介绍项目 大数据开发工具有哪些(详细介绍) 数据倾斜解决
自我介绍 后端简历为啥来投数开 了解过spark和hive吗 没有 实习做了什么有什么收获遇到了哪些问题 写题:三数之和(忘排序了😭)搁那debug半天 sql: 统计每个班学生人数 统计每个学生平均成绩 统计每个班成绩前三的同学 统计每个班数学成绩大于英语成绩的同学 对了两道😭 你有什么爱好 你的优缺点是什么呢 你来实习的话可以实习多久 反问 感觉大g特g,方向不太对口,自己还是菜
岗位:软件开发工程师-数据开发方向 部门:核心本地商业-基础研发平台 技术岗位处女面,运气挺好,没有被问到完全不会的题,感谢团子缓解我的焦虑 4.30 一面(60min) 1.自我介绍 2.介绍项目架构,数据源等 3.项目中遇到的难点 4.数仓为什么要分层,各层的职能 5.讲一下项目中提到的零点漂移问题 6.hive结构, 7.hive优化 8.数据倾斜 9.tcp三次握手 10.进程和线程的区别
#软件开发2024笔面经##美团# 首先大赞美团面试官们,真的很有亲和力,一直安慰我别紧张,没事 时间有点久了,写一下我记得的 一面 4.22 大概半小时吧,因为我简历写了挺多树模型,问这个比较多。 先自我介绍,然后面试官也介绍了一下部门。 1、三种经典决策树,以及所使用的划分标准,能否用于分类或回归 2、xgboost和gbdt的区别 3、集成模型有哪些,解释一下 4、数据不平衡的处理 5、My
4/22 一面 4/26 二面 5/ 1 offer emm,昨天加hr微信,没加我,但今天51居然发了offer,可能他工作日忘记发offer了吧..
美团鞭尸复活赛数据开发4.29一面,第二天没约二面,希望五一后有二面 #你收到了团子的OC了吗# #美团#
自我介绍 深挖简历 做算法题 凉————凉
1.自我介绍。说多了被打断了,寄😫。 2.介绍项目背景和内容,主要做的工作。 3.项目中的数仓是依照案例开发还是自己设计的?模仿开发过程,实现数据域的开发。 4.项目中有宽表设计和hive调优,如何做的。讲了宽表设计原因和退化的维度,hive调优主要做的数据倾斜,将热点数据拆分出来,单独处理。 5.单独拆分多出一张表,增加了存储压力,有什么帮助吗。数仓设计理念就是用空间换取时间,不怕数据大,就怕
我傻了,一个八股没问,而且我好像说错话了,完蛋了😭 团子给我个机会吧
👥 面试题目 1.自我介绍,能不能从几个方面说一下项目 2.有什么收获 3.简历里面哪个技术学的最好 4.spark的client模式和集群模式 5.yarn 6.能够重分区的算子 7.为什么用rdd,不用df和ds,他们的区别 8.为什么spark比mapreduce更快(磁盘io和进程线程模型) 9.spark也会OOM和溢写磁盘啊,mapreduce也有缓冲区啊,都是内存计算,为什么更快(
一面——60mins 自我介绍 拉链表的制作,数据量有多少,为什么不用快照表呢 项目有哪些表 数仓分层有哪些,具体做了什么,数仓分层作用 怎么设计表,怎么建模,DIM DWD层的主题分了哪些 如何做的可视化 什么是数据倾斜,数据倾斜的解决方案 Hadoop和spark的区别 Spark的shuffle流程是怎么样的 对哪些数据库了解 Shuffle有哪几种类型 在shuffle的过程中会进行排序吗