本人社招,面试大数据研发工程师岗位,一共三轮面试。 1、一面(技术面),约40分钟,面试题如下: (0)自我介绍,别照着简历说,补充说些简历上没有的,比如哪里人、兴趣爱好、优势有哪些等。 (1)笔试,编程题,语言自选,题目:输入一个字符串,找出其中的整数,按升序排序后输出,多个相连的数字为一个整数,排序可用类库自带方法。 实现很简单,这里就不提供答案了。 (2)笔试,SQL编程,
1. 自我介绍,项目介绍 2. 自我介绍的时候问我这些东西是自己学的还是学校讲的。 内心:在说什么。。。 3. 因为简历上第一个写的是使用爬虫进行数据挖掘,但是没用flume进行数据采集,所以就简单的说一下当时是把数据采集成csv或者data格式的文件,直接上传到的Hdfs,直接使用load path加载到hive当中。 并且当时介绍了数据集的大小,以及介绍了可能会产生的问题, 4. 面试
面试时长 55min 一位很友善、技术水平很高的大哥 面试官自我介绍:来自美的数据库与大数据平台部门。主要做全集团的基础数据平台研发(分大数据平台,数据库平台两个方向)。Spark 部分快忘光了,正好趁这次机会复盘一下! 大数据相关: 面试官问:Hadoop 和 Spark的区别说一下? Hadoop的数据处理单位是block,Spark 提供了可供并行处理的数据抽象RDD Hadoop 对数据处
8.26 50min左右 首先自我介绍,然后问了许多项目的问题 然后问了mr的原理和运行流程 hive如何确定reduce的数量 Spark和mr的区别 数仓分层 数仓维度建模问题 什么是维度表和事实表 数据库的三范式 做题 首先是一个sql题,很简单,但是我只刷了大量的java题不会sql的呜呜呜以后一定多刷 然后写了一个归并排序 面试官人超好,特别有耐心 上天保佑让我一面过吧! #快手面试
快手数据研发一面(45min) 一面:技术面 一位面试官:一位特别特别特别特别好的面试官【我真的好走运,遇到面试官真不错】但是个人太菜了,估计凉了。 1、个人介绍 2、硕士期间的课程(与大数据相关的软件会在课程教吗,还是自己学的) 3、本科期间获得的最高奖项 4、项目中搭建Hadoop集群是用集成好的,还是单个组件搭建的 5、集群中用了几个节点,每个节点的存储配置。 6、HDFS的读写流程,大致说
女面试官:人超级nice hadoop搭建过程中有哪些注意点 hive怎么进行优化 jar包冲突了怎么解决? hive和sql有什么区别 后面基本就八股了 八股背的太不熟了 jvm是什么 == 和 equle有什么区别 面试官全程引导,会说自己的想法人超级棒(我觉得我挂啦,现在就回去背八股呜呜呜) #度小满#
1.自我介绍 2.实习项目深挖(数仓) 3.主要负责哪一部分? 4.在数仓建设中做了什么? 5.如何去建立数仓表并规范化?(这是我上面提到的) 6.在建设数仓表的过程中数据有丢失怎么处理? 7.每天拉取数据的时间点,拉取数据任务中会注意什么?(任务是否有延迟,造成延迟的原因,是否有数据异常) 8.会有数据异常报警吗?怎么看数据是否异常?(根据数据量是否正常,数据会存在部分丢失,但是如果是在一定的范
了解哪些大数据组件 Shuffle 的作用是什么 Shuffle 中合并的操作有什么用/好处 MapReduce 中出现数据倾斜怎么处理 Yarn 有哪几个比较重要的进程 ResourceManager 主要的作用 ApplicationMaster 主要的作用 任务的监控在哪个进程 ZooKeeper leader选举机制 ZooKeeper 读写一致性具体体现在哪些地方 Spark 宽窄依赖
一面(2023.9.15) 11点开始,11点41分结束 面试官很和蔼,不过周围有点吵。(面试官叫王xx,我不太记得了,人挺好的) 自我介绍 实习项目介绍(我这真是面出经验了,只要你项目他不感兴趣,接下来就是八股时间) 学校里有什么课程 八股问的多到离谱,总共就30分钟不到,全八股。 int和Integer有什么区别? Integer(200) new 两次,他们是一样的吗? valueOf方法介
40min 自我介绍 看到主要研究是在算法上,只是想要算法的工作还是数据分析相关的岗位也可以呢? 投递的论文的刊物的等级 试验班的是怎么选拔的?所学的基础知识课程相同吗? 详细介绍一下项目? (对项目中一些存在的问题提出疑问) 在项目中,运用了聚类的方式,讲一下具体是怎么聚类的 聚类算法简单介绍一下 科研项目的代码量 评价一下自己的代码能力,和工程性很强的男孩子比你觉得你的代码能力怎么样? 项目介
### 一面 自我介绍+实习经历 (31608)### 二面 1. 自我介绍 2. 实习经历,我说了JVM的重用 3. JVM重用的底层原理 4. sql输出排名前七的学生 5. hive处理小文件的方式 6. hive组件,原理 7. hiveSQL转化为mapreduce的执行过程 8. hive执行过程中的优化 9. 为什么使用环形缓冲区 10. HDFS组件 11. secondnamen
9.21 自我据介绍(面试官说简历上都是python项目,笔试用c++做的,就问c++。。。) c++容器有哪些?序列容器?关联容器? 函数重载?重写?重定义? 虚函数什么情况下使用?内存有什么不同?虚表大小? 手撕题(链表) 计网问题: 三次握手 粘包?怎么解决?因为开启了什么算法? 怎么排查网络问题? 反问的时候说今年没有专门数据研发岗,是进去之后再分配岗位,后端开发可能要转java 攒人品,
一面: 1.自我介绍, 2.询问了实习中的项目具体内容,提出了一个场景,问如何保证准确率 3.sql的执行顺序 4.数据库的索引类型 5.sql题 一道非常简单 还有一道要用到窗口函数 求连续三天登录 6.还有其他问题 有点记不清了 一面结束之后大概是隔天就收到了二面消息 二面: 1.自我介绍 2.问实习期间的项目 问了好几个小问题 3.问之前学习过程遇到的困难 怎么处理的 4.问MySQL和Or
一面难绷,上来就问hashmap 我说先自我介绍吧,面试官说啊对对对 介绍完了,开始问项目,问实习, 全程听完之后,好,下一个问题哈,瞟一眼出题,然后八股,问了十几分钟 我也懒得答太详细了 就给我出题,反转链表 精彩部分来了,他不知道哪里把题目发给我,也不知道让我在哪里写,我说不用发题目给我,我在聊天框写,写了一会发现格式难调,他就让我口述,口述完之后,他就说你有什么想问的吗,我说我没什么想问的,
上来先做了一道 最近登录日期 的sql题 然后开始问大数据八股,,,, 1. mapreduce map端的shuffle过程 2. spark stage 划分的依据 3. 宽依赖和窄依赖 4. 了解kafka吗 5. spark sql与mysql sql的区别 6. spark dataframe 和dataset的区别 7. 数据库中id设计 除了uuid和时间戳,还有什么方式 #招银网络