一面难绷,上来就问hashmap 我说先自我介绍吧,面试官说啊对对对 介绍完了,开始问项目,问实习, 全程听完之后,好,下一个问题哈,瞟一眼出题,然后八股,问了十几分钟 我也懒得答太详细了 就给我出题,反转链表 精彩部分来了,他不知道哪里把题目发给我,也不知道让我在哪里写,我说不用发题目给我,我在聊天框写,写了一会发现格式难调,他就让我口述,口述完之后,他就说你有什么想问的吗,我说我没什么想问的,
2022.10.9 一面 共15分钟 1.自我介绍:大概两分钟 2.问答: a.实习经历-sql是如何优化的 答得不好,明明是准备好了的, 一是优化整体逻辑,二是语句优化,只答了第一点,一定要清楚面试官问问题的内在目的,不要回答那么表面。 b.实习经历-窗口函数,三个排序(row_number, rank, dense_rank)的区别,答得不好,明明也是知道的,就按准备好的说,不要现场发挥啊……
动不动就被打断!!!!!面试体验感太差了,好几次都想骂回去了 而且招什么数据开发,改成全干工程师好了 11.9 一面 1h zookeeper选举机制 zookeeper分布式锁? 手撕二分查找(递归、非递归:两个函数参数问的不一样,还得问我为什么用不一样的参数名,有啥区别.....) 对Yarn的理解?Yarn工作机制?(说到一半又被打断,让用程序来实现)手撕Mapreduce程序 Spark的
23.5.30快手一面 1、介绍项目 这里都根据个人项目去聊的,问了很久 2.数据怎么来的(ods层数据同步问题)ads层下游怎么做,数据怎么来的报表直接查的ads层吗 数据抓过来存在哪 3.hadoop了解吗hdfs有那些组件, 4.聊聊mapreduce进行几次排序 一个sql题,按分数进行排序 count(*) count(1) count(col)三者有什么区别 数据倾斜 pv值 23.5
整体的面试内容会结合项目和实习经验进行提问,面试官人很好,问题也是由浅入深。 有监督学习和无监督学习的区别 过拟合的处理方法 梯度下降法原理 损失函数作用 实习的主要内容 ES中索引的类型和作用 ES的优点 mapreduce的原理 还问了一些数仓的知识 没答上来 数学建模 模型的类型(记得好像是这样 一道简单算法题 反问
自我介绍 接下来就是问一堆奇怪的问题夹杂着八股 行式存储vs列式存储 MapReduce流程 Spark流程 Yarn流程 Kafka流程 维度建模 数仓分层 你写没写过MR源码? 你怎么看流批一体? sql 求视频累计观看数 答的一般 感觉凉了 #数据人的面试交流地#
刚面完,面试官挺和蔼的 开头自我介绍+项目+追问细节 看我还没做笔试,就没问算法相关的,说做完笔试再说 一道情景题,如何对网上言论的质量进行分级,尤其是一些专业领域内的言论 可能因为我是非科班本科生吧,就没考八股,亏我准备了那么久的hadoop 最后说笔试之后再约一次面试 反问
数仓理论,项目,问我从哪了解的数仓,我说项目学习和大数据之路,面试官笑了“谁推给你的这本书” 然后sql题 反问 实习生干什么~指标搭建,应用层简单建模,可视化 18分钟解决。。。 大厂的实习总是这么迷惑,小米按校招流程给我又是sql又是算法一顿鞭策,这个15分钟告诉我结束了,而且这位好像是负责我的业务导师。。
背景:985本硕,无实习,自学大数据相关技术栈,尚硅谷离线+实时数仓,实验室项目。 hdfs读写流程 mapreduce shuffle maptask和reducetask数目如何确定 小文件过多对namenode有什么影响 mr优化有哪些点 进程和线程 hive sql转换为mr的过程 离线数仓项目:项目流程,思考,价值 如何保证数据一致性 如何衡量两个数仓的优劣 两道题: 1-1000的递增
CTO(现爱橙科技)- 外部数据 暑期实习 一面 自我介绍 实习做了哪些工作,介绍一下 在学校主要研究方向是什么,用的什么编程语言 python掌握得怎么样 juc 乐观锁,悲观锁 mysql哪些字段应该建索引 一张很大的表,如何优化查询效率 如果kafka数据丢失,可能是哪些原因 数据仓库分层讲一下 开放题:不限制条件,器材,方法,求解西湖的水有多少升?(一脸懵逼) 二面 自我介绍 数仓项目介绍
CTO-数据产品与技术部 暑期实习 一面 自我介绍 是保研的吗 实习做了哪些工作 为什么想做数据开发 研究生的方向 本科学过哪些计算机专业课 栈和队列的区别,应用场景 二叉树了解吗, 平衡二叉树了解吗 了解哪些排序算法, 分别说下原理和时间复杂度 快排的最差时间复杂度, 为什么,怎么优化 TCP三次握手, 为什么不是两次 MapReduce运行流程说一下 udf,udaf,udtf区别 spark
5/5一面 5/14 二面 5/18 hr面 5/19 OC 一面(1h10min) 1.自我介绍一下 2.介绍一下你的项目 2.1 Mysql全量数据规模 2.2 既然Mysql能存储,为什么要导入到hive中 3.说一下MySQL的ACID特性 4.脏读和幻读分别是什么含义 5.spark持久化的级别和作用 6.spark任务出现数据倾斜有哪些方法解决 7.hive没办法创建分区怎么理
部门:网易云 8.23约面,8.25 一面 8.29 二面。8.30 hr面 一面: 45min左右 1.自我介绍 2.说说项目用到了哪些技术 3.你刚刚说到了即席查询,项目里是怎么做的。 4.四道sql,十分钟后对答案 5.笛卡尔积了解吗。 6.笛卡尔积会产生什么问题。 7.你刚刚说到了数据倾斜。介绍一下。 8.笛卡尔积就会产生数据倾斜吗 9.mr流程介绍一下 10.你多久能来实习 11.你刚刚
自我介绍 问对hadoop各个组件的了解 解释下mapreduce的过程 问有没看过谷歌的GFS论文 问项目里数据库咋建模设计的 对维度建模的了解 对数仓的了解,数仓一般咋分层 GGGG,这之前只关注框架底层了,,没看过数仓的东西#大数据开发面经##实习生[话题]##access#
首先做了三道SQL题,主要涉及分组聚合、窗口函数。 3.3 一面 28min: 1.自我介绍 2.为什么要做这个项目 3.介绍DataX 4.项目问题 5.介绍HDFS 6.Hadoop hive hdfs spark关系 7.职业规划 8.数仓分层 9.窗口函数 3.6 二面 45min: 1.自我介绍 2.项目介绍 3.维度模型 4.一道数仓场景题 5.数仓分层 6.SQL常用函数 7.ran