了解哪些大数据组件 Shuffle 的作用是什么 Shuffle 中合并的操作有什么用/好处 MapReduce 中出现数据倾斜怎么处理 Yarn 有哪几个比较重要的进程 ResourceManager 主要的作用 ApplicationMaster 主要的作用 任务的监控在哪个进程 ZooKeeper leader选举机制 ZooKeeper 读写一致性具体体现在哪些地方 Spark 宽窄依赖
一面(2023.9.15) 11点开始,11点41分结束 面试官很和蔼,不过周围有点吵。(面试官叫王xx,我不太记得了,人挺好的) 自我介绍 实习项目介绍(我这真是面出经验了,只要你项目他不感兴趣,接下来就是八股时间) 学校里有什么课程 八股问的多到离谱,总共就30分钟不到,全八股。 int和Integer有什么区别? Integer(200) new 两次,他们是一样的吗? valueOf方法介
40min 自我介绍 看到主要研究是在算法上,只是想要算法的工作还是数据分析相关的岗位也可以呢? 投递的论文的刊物的等级 试验班的是怎么选拔的?所学的基础知识课程相同吗? 详细介绍一下项目? (对项目中一些存在的问题提出疑问) 在项目中,运用了聚类的方式,讲一下具体是怎么聚类的 聚类算法简单介绍一下 科研项目的代码量 评价一下自己的代码能力,和工程性很强的男孩子比你觉得你的代码能力怎么样? 项目介
### 一面 自我介绍+实习经历 (31608)### 二面 1. 自我介绍 2. 实习经历,我说了JVM的重用 3. JVM重用的底层原理 4. sql输出排名前七的学生 5. hive处理小文件的方式 6. hive组件,原理 7. hiveSQL转化为mapreduce的执行过程 8. hive执行过程中的优化 9. 为什么使用环形缓冲区 10. HDFS组件 11. secondnamen
9.21 自我据介绍(面试官说简历上都是python项目,笔试用c++做的,就问c++。。。) c++容器有哪些?序列容器?关联容器? 函数重载?重写?重定义? 虚函数什么情况下使用?内存有什么不同?虚表大小? 手撕题(链表) 计网问题: 三次握手 粘包?怎么解决?因为开启了什么算法? 怎么排查网络问题? 反问的时候说今年没有专门数据研发岗,是进去之后再分配岗位,后端开发可能要转java 攒人品,
一面: 1.自我介绍, 2.询问了实习中的项目具体内容,提出了一个场景,问如何保证准确率 3.sql的执行顺序 4.数据库的索引类型 5.sql题 一道非常简单 还有一道要用到窗口函数 求连续三天登录 6.还有其他问题 有点记不清了 一面结束之后大概是隔天就收到了二面消息 二面: 1.自我介绍 2.问实习期间的项目 问了好几个小问题 3.问之前学习过程遇到的困难 怎么处理的 4.问MySQL和Or
一面难绷,上来就问hashmap 我说先自我介绍吧,面试官说啊对对对 介绍完了,开始问项目,问实习, 全程听完之后,好,下一个问题哈,瞟一眼出题,然后八股,问了十几分钟 我也懒得答太详细了 就给我出题,反转链表 精彩部分来了,他不知道哪里把题目发给我,也不知道让我在哪里写,我说不用发题目给我,我在聊天框写,写了一会发现格式难调,他就让我口述,口述完之后,他就说你有什么想问的吗,我说我没什么想问的,
上来先做了一道 最近登录日期 的sql题 然后开始问大数据八股,,,, 1. mapreduce map端的shuffle过程 2. spark stage 划分的依据 3. 宽依赖和窄依赖 4. 了解kafka吗 5. spark sql与mysql sql的区别 6. spark dataframe 和dataset的区别 7. 数据库中id设计 除了uuid和时间戳,还有什么方式 #招银网络
20220928杭州银行数据研发岗一面 写在前面:等了半个小时才进,在这里记录下流程 面试流程 自我介绍 两个面试官,第一个因该是数仓方向,第二个因该是大数据平台开发方向 数仓方向先问的,问知不知道TCP,问三次挥手为什么有三次 问get和post的区别 问知不知道数仓,说大概知道 问知不知道自然键,然后我说没有了解过这个概念 大数据平台开发方向继续问 问spark任务提交的流程 问RDD概念 问
2022.10.9 一面 共15分钟 1.自我介绍:大概两分钟 2.问答: a.实习经历-sql是如何优化的 答得不好,明明是准备好了的, 一是优化整体逻辑,二是语句优化,只答了第一点,一定要清楚面试官问问题的内在目的,不要回答那么表面。 b.实习经历-窗口函数,三个排序(row_number, rank, dense_rank)的区别,答得不好,明明也是知道的,就按准备好的说,不要现场发挥啊……
✨添可和博世面经来啦 2️⃣基本上添可一面面试官的提问都是环环相扣的,根据你的回答,进行下一个提问,实际上提的问题应该比我回忆出来的要多,会围绕简历、过往经历以及岗位需求三个方面展开 添可二面是与HR部门经理1v1视频面试 提问如下: 1.自我介绍 2.为什么从本科到研究生专业跨度这么大 3.职业规划 4.对这个岗位的理解 5.会用哪些软件来计算数据 6.会从哪几个方面去推广校园招聘 7.怎么计算
本来以为是偏运营 没想到是偏数据。感觉凉了 面试官迟到了三十分钟!!! 问了对数据运营的理解 数据分析项目深挖 sql 数据库知识 然后是你觉得自身的优势 两个面试官都很冷漠 对我不是很感兴趣😂
面试时间:10-19 岗位:数据研发工程师 时长:15分钟左右 形式:单面,面试官是一个小姐姐 1、1-2分钟自我介绍 2、你是学硕,有什么项目经验/科研成果 3、为什么来中移杭研?你做的项目都是偏医疗影像的,不考虑去相关的医疗公司吗? 4、研究课题有落地应用吗? 5、掌握的技术栈/开发语言? 6、目前有offer吗? 7、个人的优势和不足 8、10.29线上笔试会参加吗?接受岗位调剂吗? 9、
动不动就被打断!!!!!面试体验感太差了,好几次都想骂回去了 而且招什么数据开发,改成全干工程师好了 11.9 一面 1h zookeeper选举机制 zookeeper分布式锁? 手撕二分查找(递归、非递归:两个函数参数问的不一样,还得问我为什么用不一样的参数名,有啥区别.....) 对Yarn的理解?Yarn工作机制?(说到一半又被打断,让用程序来实现)手撕Mapreduce程序 Spark的
阿里 数据研发 8月底 一面 9月中 二面 30-40min,面试内容都差不多 大数据:hadoop了解多少?讲讲mapreduce,其中有几次排序?hive?hive调优? 数据仓库:星型,雪花,星座模型;数据分层 -- ODS,DWD,ADS,作用(我回答承上启下) 手撕SQL:窗口函数,查找连续三天的记录 等等数据仓库和大数据的问题 开放性问题:服装厂秋季生产什么样子的衣服? 实习经历,内容