7.11一面: 1.自我介绍 2.拷打项目,项目遇到的难点,怎么解决的。 3.数据倾斜 4.数仓分层怎么做的以及作用 5.对数仓的看法 6.小文件的危害 7.介绍一下yarn 8.java三大特性 7.12二面: 1.自我介绍 2.拷打项目 3.拷打论文 4.实习遇到的难点,怎么解决的 5.一道简单sql 6.能实习多久
对Hadoop的了解 MapReduce的工作流程 虚拟内存的工作原理页面置换算法(LRU、FIFO、LFU、最佳置换) Hive的功能和优点常见的数据结构(数组、栈、队列、链表、树、图、堆、散列表) 堆的概念及分类常见的排序算法(冒泡排序、选择排序、快速排序) 平衡二叉树的定义查找平衡二叉树节点的时间复杂度
作为开发者,需要不断的对技术点进行总结,并且把它沉淀下来,写技术博文无疑是最好的方式,随着时间流逝,还可以作为自己每个阶段的技术认知轨迹进行回顾和反思,这里将会持续记录对WEB开发相关总结内容。
字节大数据开发工程师- 人力科技面经 一面 网络模型,每一层的功能 访问一个网页的流程 tcp是如何保证可靠 线程和进程的区别 JVM的内存区域 垃圾回收算法 类加载的过程 Spark和MR的区别 Spark任务调度过程 spark中stag,job,task是如何划分的 spark宽窄依赖 为什么spark比MR快 Hadoop的框架 Hadoop提交作业的流程 Hadoop中是如何找到文件对应
30min 1. 自我介绍 2. 为什么走大数据 3. 项目介绍 4. hive和spark的区别 5. MR和spark有哪些区别,分别适用什么场景 6. 为什么不选择spark做离线 7. 开窗函数有哪些 8. 数仓怎么设计的 9. ODS层存在的意义 10. DWD和DIM怎么设计的,有什么指标 11. DWS层存放的哪些指标 12. 下一步准备学习什么?怎么学习? 反问 1. 部门做什么业
1、自我介绍 2、什么是维度建模?什么是关系建模? 3、星型模型和雪花模型有什么区别? 4、数据仓库分层的意义是什么? 5、对哪些大数据框架比较熟悉?(答了Hadoop和Kafka) 6、Hadoop的进程有哪些?作用分别是什么? 7、Kafka的特点是什么? 8、Kafka为什么可以支持海量数据吞吐? 9、问实习工作内容,以及实习收获 10、能否接受加班? 11、有什么问题要问我的?问了日常工作
去年秋招拿了携程-大数据底层框架开发岗位的offer,想着还是把面试回顾下吧,给后面的朋友一个参考。 这个岗位是做大数据组件底层二次开发的,我面试的是偏向离线方面,因此面试都是围绕hadoop、spark、hbase、hive这几个组件的底层原理去问,因为是偏向底层,所以也会注重java语言和多线程并发的知识。 HDFS的写入流程?如果一台机器宕机,HDFS怎么保证数据的一致性?如果只存活一台机器
HR面感觉挺好的不知道咋挂了 1、自我介绍 2、如何看待实习和学校学习 3、期望薪资 (感觉是这个问题,我答的是:该岗位一般是10k-15k,所以我觉得不能少于10k) 3、为什么来广州,为什么不在武汉找工作 4、手里有Offer 吗,不满意的点,(我答的薪资和公司文化) 5、抽取的问卷题,物业不让养狗,怎么看 今天看到消息,挂掉了,没搞懂为何挂了,自我感觉答得还不错,也不紧张 心里还好没有多大落
开局自我介绍,然后问我两段实习经历,分别做了什么?照实回答,问我有没有接触过BI工具,我说是内部封装好的;日常工作,处理的数仓规模,人员规模,主要负责内容,处理的数据的大小。之后让我写一道题目,求连续三天消费金额大于100的用户ID,不想用排序函数再写了所以用了LAG函数来写,面试官给了我一个不置可否的表情(坏了可能写错了......)然后说我明白你的思路了,我解释说因为不想用排序函数来写所以尝试
投递岗位:大数据开发工程师(广州) 时间线:9.5投递,9.13技术一面,9.17技术+hr二面,9.19测评,10.7 意向 JD如下,岗位偏数据平台建设,非数仓 面经 技术 自我介绍 项目中最大的收获是什么,数据治理讲一下 hive分区表怎么创建(具体到关键字),分区的好处,怎么设计分区 hive分桶表怎么创建(具体到关键字),分桶的好处 hive外部表建表语句 (具体到关键字) hive s
1.数仓和数据库的区别 2.数仓建模 3.hive用到的函数 4.rank,dense_rank,row_number的区别 5.hive数据倾斜的原因有哪些 7.如何理解数据质量? 6.java,scala会用吗? 7.期望薪资多少?(感觉说出来就无了) 面的初级岗位。
选择题(15道): 以xx为基准的一趟快排后的结果 分块查找的比较次数 给定入栈元素计算出栈序列的可能性 简单无向图的邻接矩阵零元素数量 哈夫曼编码一个字符串所需的编码长度 ping没有用到的网络协议 操作系统创建进程的过程 电话号码前缀查重需要的内存 (别的忘了,整体还好,纯408真题) 填空题(5道): 二叉排序树的查找 多线程的四种同步方式 IP子网划分求掩码 (别的忘了,都不难) 简答题(
9.4 下午面完全部 9.9 已意向 一面 40min warm-up 自我介绍? 介绍数仓分层架构? 写SQL temp表 user_id,order_date 求出每位用户的第一次下单信息? 如何优化SQL?利用 Hive 按照日期分区的特点进行优化,写SQL。 留存率是如何计算的?写一下? 再写一个如何计算7日内留存率? 基础知识 说一下数据倾斜的概念? 说一下MapReduce Map端会
面了差不多有四十分钟 ①首先问了下项目flume 和 kafka相关,由于很久没复习这两个组件,回答的不好 ②说一下HDFS读写原理 ③JVM内存区域介绍一下 ④有哪些垃圾回收器,你就说CMS就行了,他的基本原理以及优缺点,其中四个阶段哪些阶段需要stop the world ⑤Java对象内存是如何分配的,有哪些分配方法? ⑥分配对象的过程中会出现并发问题吗,JVM是如何解决的? ⑦有用过JVM
全程面试一个小时,先聊实习,再聊数据结构和操作系统八股文,中间给了一道设计数据库缓存的情景题,最后出了一道实现双向链表插入、查找、删除的算法题。整体感觉面试难度适中,面试官很有耐心也很温柔,面试体验不错。 实习经历 (1) 研究生期间做深度学习,为什么就业想要走开发岗? (2) 现在的实习才四个多月,为什么想要换一份实习? (3) 项目各种技术细节如何实现的(不展开说了) (4) 对你来说最有成就