8.29一面 一面一个小时,深挖项目,问了很多hdfs和一些操作系统底层原理,hdfs读写流程+心跳机制+副本机制+HDFS纠删码,手撕lc第15题改编题,撕出来了 关于虚拟化有一个印象深刻的问题,当前资源数为7,有4个用户,每个用户需要资源数为2,如何在当前时间段为这4个用户创建虚拟机,满足每个人的需求?我答时间片,面试官说也是一种思路,不过她想让我下去看一下超配。 八股: 什么是tcp四次挥手
1. 面试官很好,因为他刚下班,所以双方开头相互介绍自己,后面问我有实习过吗,我就如实回答了在广州亚信这边实习过,还问我离职原因什么的,我又不能直接说在公司学不到什么,后面就乱编理由说是因为自己没戴口罩上班感冒了(其实是真的感冒了然后真的感觉学不到什么所以想辞职),面试官就说难道你来深圳身体就好了吗,后面我就说因为家里原因,面试官就不再追问了 2. 开始拷打八股,感觉他问的我之前好像都没怎么看过,
47、zookeeper是什么? 主要服务于分布式系统,可用来做统一配置管理、统一命令服务、分布式锁、集群管理等 48、zookeeper的作用以及适用场景? 数据的发布订阅:由于大数据集群中节点过多,不可逐台进行修改,在设计时候采用统一的配置中心,之后只需要将新的配置发送到配置中心,所有节点都可自动下载更新命名服务:zk通过顺序节点的特性来生成全局唯一IDMaster选举:让所有服务节点去竞争性
自我介绍(尽量与职位相关) 数据仓库的分层结构 如何为新业务建模 选择模型的依据和考量 设计一个一对多关系的事实表和维度表 实习中使用的计算引擎 Spark UI的关键内容 数据倾斜问题的解决方法 项目介绍 指标下沉时为何要拆分 SQL调优的具体案例 SQL题:求中位数
发帖求好运 部门:基础研发平台-数据科学与平台部 --------- 一面:57min 1.自我介绍; 2.讲最熟悉的项目; 3.爬虫遇到的问题,如何处理的呢; 4.mysql:left join \ right join \ full join,用一个案例讲一下; 5.数据仓库了解吗; 6.Hashmap的原理了解吗; 7.Hadoop了解吗; 8.NameNode了解吗; 9.HDFS为什么安
1.问项目 2.接触过数据库有哪些 3.用过mysql的哪些功能 4.有没有优化过mysql的性能? 5.linux常用命令 6.hive表类型 7. 内部表和外部表区别 7.左连接右连接全连接内连接 8.hdfs shell 问的都打上来了 面试官说下周发offer= = 整个过程13分钟,好快,想到第一个面试1.5hT T
1、flume架构组成以及作用 2、flume到kafka中,如何保证同一个组件的数据放在kafka同一个分区里面 3、kafka支持全局有序吗?kafka isr?介绍kafka副本与hdfs副本区别 4、zookeeper在项目中的作用?如何判断节点是否存活? 5、HDFS什么功能用到了zookeeper? 6、spark的执行流程,比如做一个wordcount 7、sparkcontext内
刚刚oc了,有没有佬可以介绍下shopee food的情况,bp搜推算法 #shopee#
字节大数据开发工程师- 人力科技面经 一面 网络模型,每一层的功能 访问一个网页的流程 tcp是如何保证可靠 线程和进程的区别 JVM的内存区域 垃圾回收算法 类加载的过程 Spark和MR的区别 Spark任务调度过程 spark中stag,job,task是如何划分的 spark宽窄依赖 为什么spark比MR快 Hadoop的框架 Hadoop提交作业的流程 Hadoop中是如何找到文件对应
30min 1. 自我介绍 2. 为什么走大数据 3. 项目介绍 4. hive和spark的区别 5. MR和spark有哪些区别,分别适用什么场景 6. 为什么不选择spark做离线 7. 开窗函数有哪些 8. 数仓怎么设计的 9. ODS层存在的意义 10. DWD和DIM怎么设计的,有什么指标 11. DWS层存放的哪些指标 12. 下一步准备学习什么?怎么学习? 反问 1. 部门做什么业
1、自我介绍 2、什么是维度建模?什么是关系建模? 3、星型模型和雪花模型有什么区别? 4、数据仓库分层的意义是什么? 5、对哪些大数据框架比较熟悉?(答了Hadoop和Kafka) 6、Hadoop的进程有哪些?作用分别是什么? 7、Kafka的特点是什么? 8、Kafka为什么可以支持海量数据吞吐? 9、问实习工作内容,以及实习收获 10、能否接受加班? 11、有什么问题要问我的?问了日常工作
去年秋招拿了携程-大数据底层框架开发岗位的offer,想着还是把面试回顾下吧,给后面的朋友一个参考。 这个岗位是做大数据组件底层二次开发的,我面试的是偏向离线方面,因此面试都是围绕hadoop、spark、hbase、hive这几个组件的底层原理去问,因为是偏向底层,所以也会注重java语言和多线程并发的知识。 HDFS的写入流程?如果一台机器宕机,HDFS怎么保证数据的一致性?如果只存活一台机器
HR面感觉挺好的不知道咋挂了 1、自我介绍 2、如何看待实习和学校学习 3、期望薪资 (感觉是这个问题,我答的是:该岗位一般是10k-15k,所以我觉得不能少于10k) 3、为什么来广州,为什么不在武汉找工作 4、手里有Offer 吗,不满意的点,(我答的薪资和公司文化) 5、抽取的问卷题,物业不让养狗,怎么看 今天看到消息,挂掉了,没搞懂为何挂了,自我感觉答得还不错,也不紧张 心里还好没有多大落
开局自我介绍,然后问我两段实习经历,分别做了什么?照实回答,问我有没有接触过BI工具,我说是内部封装好的;日常工作,处理的数仓规模,人员规模,主要负责内容,处理的数据的大小。之后让我写一道题目,求连续三天消费金额大于100的用户ID,不想用排序函数再写了所以用了LAG函数来写,面试官给了我一个不置可否的表情(坏了可能写错了......)然后说我明白你的思路了,我解释说因为不想用排序函数来写所以尝试
投递岗位:大数据开发工程师(广州) 时间线:9.5投递,9.13技术一面,9.17技术+hr二面,9.19测评,10.7 意向 JD如下,岗位偏数据平台建设,非数仓 面经 技术 自我介绍 项目中最大的收获是什么,数据治理讲一下 hive分区表怎么创建(具体到关键字),分区的好处,怎么设计分区 hive分桶表怎么创建(具体到关键字),分桶的好处 hive外部表建表语句 (具体到关键字) hive s