8.19上午十点和十二点,两次面试间隔一个小时左右,面试时长都不超过30min,面完没消息,大概率凉了。 一面: 介绍一下离线数仓项目? 说说你理解的数仓? 数仓为什么要分层? mapreduce和spark的区别 怎么理解指标? 两个相对简单的sql题 二面: 介绍一下简历中你比较熟悉的一个项目 分主题的目的是什么? 为什么使用HBase存储维度表,怎么考虑的? HBase原理了解吗,和其他数据
刚面完,面试官挺和蔼的 开头自我介绍+项目+追问细节 看我还没做笔试,就没问算法相关的,说做完笔试再说 一道情景题,如何对网上言论的质量进行分级,尤其是一些专业领域内的言论 可能因为我是非科班本科生吧,就没考八股,亏我准备了那么久的hadoop 最后说笔试之后再约一次面试 反问
mapreduce中有哪些排序 yarn的事件驱动 hbase写热点问题 建表时怎么指定空region spark sql中dataframe怎么把表中的字段提取出来 hive怎么提取出来 yarn中的container怎么实现 写一个sql,学生不同学科的得分排名前三 手写单例模式,策略模式,工厂模式,并描述在什么场景下使用,口述一下装饰者模式 arraylist和linkedlist的区别,什
23届春招的面经,大数据方向。希望对大家有帮助,最后对比offer选择了快手。 1.投递简历: 我是通过内推进入一面,投大厂可以试试内推,有些大厂走官网我简历关都过不了,但是内推可以🤣🤣,比如阿里我官网投递简历后就没声了,后来有人内推进了蚂蚁的一面,但当时不太想继续面了就没去。这也可能是内部系统的问题,总之建议大家多试试。 2.一面和二面面经 问的问题相似,都是大数据八股,sql,还有项目和实
hdfs读写流程 spark内存管理 项目中遇到的问题,怎么解决的 项目中都有哪些表 怎么处理缓慢变化维 拉链表怎么做,开链闭链怎么 数仓和数据湖 维度建模,星型模型,雪花模型 数据倾斜,小表join小表,大表join大表 遇到过的数据倾斜,怎么做的 手撕,二叉树中序遍历,非递归写法
#百度面经# 个人情况:23届,211硕,大数据开发,数仓,入职即被裁,找工作ing... 今天面试了百度搜索的数据挖掘岗位,面试官超级nice,先大概讲了岗位情况,问下意向,由于我之前想的最长远的发展路线就是先搞底层技术,再搞分析,最后能转挖掘的话更好,就说还OK,就接着面了,一共五部分 1. 统计学 早还给老师了 2. AB实验 只听过名字 3. 机器/深度学习 知道的太基础了,没法应对面试
零售数据部门,看到帖子说态度很差,吓得我慌的一批 结果是个姐姐,态度很好 详细问了简历、项目、实习经历,对沟通过程、难点、技术点进行了深挖 数仓问了几个八股,不重要 然后就是什么性格、抗压能力、职业规划之类的 我反正周周面,面麻了,面试好不代表能进,爱咋咋地,巴不得地球爆炸
一面 1、自我介绍 2、询问本科、研究生的专业背景、技能学习、数据分析相关知识 3、询问sql、python、java等掌握情况 4、对数据支持的理解 5、深挖简历-重点:数据可视化分析维度、词云分析的重点、 6、深挖项目经历-重点:会不断挖掘你的语言漏洞,自己要能够圆回来 7、面试官针对实习经历还提出了好几个建议意见 8、逻辑题:一根不均匀的绳子,烧完是一个小时,如何判断半小时(微软算法面试题)
数据倾斜问题 写个sql吧 再写一个sql吧, 写挺好啊,在写一个吧 这些你是练习过原题吗,在写一个sql吧 说一下数仓的分层,每层干了什么事? 说一下归并排序的过程 xgboost原理 线性回归,逻辑回归 聚类了解吗 说一下spark怎么实现map join
timeline:8.8一面——8.11二面 面试形式:远程视频 面试时长:30min 自我介绍 聊聊学业:最喜欢的课程为什么、详细的例子 聊聊实习:第一段第二段第三段分别做的啥 聊聊未来:职业规划、行业选择 反问 就硬聊,全程不来电... 但又说部门目前非常缺人手hc很多,希望给个好消息吧...#数据人的面试交流地##快手##面经#
1.自我介绍 2.实习经历,具体做什么,扣简历细节 3.两道SQL题,求各个渠道第一名,还有一个想不起来了 4.反问岗位日常工作,大数据架构及原因,对于SQL优化的要求,百度drios和Apache presto的区别 第二天,HR说leader很有意愿,让我马上过去offer已发 为什么就一面,我还准备三战滴滴
1. 自我介绍 2.简单问了一下项目,对于数仓这块,你经历两段实习有什么感受 3.你使用过程中对于spark和hive有什么见解,优劣 4. 你对于数仓的理解和看法 5.日常对于spark的优化,sql的优化 6.对于刚才的两种优化场景,你觉得在spark或hive当中是对底层的那部分进行的优化(mapjoin) 手撕sql 销售额top3 前三名销售额的差值
自我介绍 实习项目介绍 对这个岗位的理解? 平时都是怎么学习,看书和github源码吗? 为什么要开发这个工具?是重复造轮子,现有的不行吗?出于什么背景? Java异常分类? Exception又分成几类?有什么区别? 捕获异常用什么? error能捕获吗? 介绍一下Java的垃圾回收机制? 都有那些垃圾回收器? Java源码看过吗?介绍一下HashMap吧 了解那些Linux命令? 写一个Lin
数据库内核开发岗位,时间线:8.3 一面,8.7 二面+三面,8.9终面(终面挂) 一二面都是做题+各种知识考察,三面偏工程问题+聊天,四面是线下老板面,当场做题没做出寄了 一面 一道题目:求x的范围,使x的阶乘有k个后缀0(找规律看5的个数) c++11新特性,介绍一下智能指针,智能指针怎么实现的,项目里怎么使用的 malloc底层原理,malloc是不是系统调用 平时遇到过什么内存问题 内存泄
开局问业务:小桔能源-加油决策中心-数据分析 1、自我介绍 2、问tx实习里的tapd是什么 3、结合tx实习问MECE法则分析的思路 4、问MAU指标拆解的过程和逻辑 5、问实习中是怎么做数据清洗的 6、问懂不懂ETL? 7、提问,滴滴,比如说7月份它的一个用户的D a u下降30%,你看你会怎么去分析? 8、问机器学习模型 9、问k均值算法,k怎么确定 10、sql题,一个打车订单表: (1)