面经:主要看学历40%、项目经历30%、籍贯30%,一共17分钟 1.自我介绍 2.负责项目和擅长的编程语言(注意:项目大小由面试官判断) 3.hdfs流程 4.编程语言八股(好笑的是说python面试官都蒙,说Java才能走流程 5.项目追问 遇到问题: 1.非硕不要报,就是刷kpi的,海外本科可以报下,有点恶心; 2.非当地省份户籍的慎重,否则同样kpi,面试官比较看重这一点,对外地很会阴阳怪
我是学数学的2024应届,本科阶段有选过大数据的专业选修课,但是编程语言真的不太会,跟科班出身的计院同学没法比,今年数分岗又卷到爆炸,双选会问了几个公司都说数分岗爆满(快手中移信息技术中心),只好一并找找其他方向,上周笔试以为铁挂了就没怎么准备,结果昨天晚上22点发今天的一面邀,一个晚上加上午恶补大数据知识。面试官非常和蔼: 问项目: 大数据技术实验做了什么东西?是为了实现什么?(本科课程里的实验
岗位JD 使用大数据组件对海量数据进行建模,参与数据仓库的的开发、维护及优化 岗位要求 计算机相关专业,对大数据有浓烈的兴趣 扎实的计算机基础,熟练使用python/java/scala其中至少一种语言 熟悉Hadoop生态体系,包括但不限于Hadoop/Hive/Spark/Clickhouse 学习能力强,强烈的责任心,具有较强的沟通能力及团队合作精神,细致耐心、积极主动 有大规模数据/日志处
15min 八股 + 50min 手撕代码 八股: 如何判断java对象可以被回收 手撕:1、LRU缓存 2、mysql mysql主播表: 用户id,房间id,开播时间,下播时间,房间开启状态(0、1),日期 第一问:求每个主播每一天的开播时长 第二问:求每个主播一天内每小时的开播时长 没想到主播可以跨天直播,寄! 本java后端菜鸡,被大数据开发爆杀😂
介绍项目,细问了一些项目中的知识点 spark RDD宽窄依赖 sql编程汇率换算 python二维数组查找数据 mysql hbase比较 hbase行列存储 mysql能否直接查数据中某一列的特定数据,hbase能不能(这块问的我没太听明白) mysql两种表引擎 对事务有什么理解,举个例子 大数据协同算法,保持一致性举几个算法例子 有什么要反问的 大概就是这些问题可能差一两道忘了,hbase
1.自我介绍 2.实习经历,具体做什么,扣简历细节 3.两道SQL题,求各个渠道第一名,还有一个想不起来了 4.反问岗位日常工作,大数据架构及原因,对于SQL优化的要求,百度drios和Apache presto的区别 第二天,HR说leader很有意愿,让我马上过去offer已发 为什么就一面,我还准备三战滴滴
1.自我介绍 2.项目介绍 3.MapReduce揪着排序问 Spark揪着OOM问题问 hr和技术一起面,总共20min
目前去团子了。总结一下一个多月以来找实习的历程,也算是非常坎坷了,好在最后结果还行,最后说一句我是团孝子 #暑假实习# #美团# #大数据开发#
7.15一面: 1.自我介绍 2.项目深挖(聊了很久) 3.对数仓的看法 4.主题域及其建设过程(要落地,谈业务过程) 5.讲一个熟悉的指标体系构建(没做过) 6.为什么不考研 7.为什么想跳槽 8.sql留存率(讲了下思路就行了) 反问: 1.为啥晚上6点还面试,唯品会不是955吗 2.唯品会的计算引擎选型是什么 ------------------------- 挂了
1.问本科经历,对大数据的接触 2.问项目是否是真实项目或者实习项目,,不是demo 3.项目介绍,毕设项目讲了15分钟 4.where和having区别(having能单用) 5.Spark宽窄依赖 6.leftrightinnerjoin 7.sql写题,统计所有月销售额超过1w的员工 8.反问,ABtesting--是否是埋点-PVUV-灰度策略的流程
7.10一面 手机面,也没提前约时间,电话打过来就直接面了😭😭😭都没准备好 了解java的内存分配吗? 什么是内存泄露,如何解决内存泄***r>介绍一下java垃圾回收机制。 介绍一下java线程和进程。 多线程的好处。 java创建多线程的方式。 java如何保证线程安全。 说几个java集合。 什么场景下使用什么集合? hashmap是线程安全的吗,hashtable如何保证线程安全的?
简历没写算法和机器学习的东西,就只是方向是这个,然后面试的时候机器学习问好多?真的是有点懵 一面问nlp,二面问我会不会协同过滤,明明招数仓,数仓东西又不问,真的是服 8.29 一面 全程 30min不到 自我介绍 数仓的优势 介绍下数据库的范式 介绍项目中的Flume 常用的语言有哪些?Java和Scala的区别?什么是范式编程? 设计模式了解多少? ETL步骤 常用的机器学习算法?随机森林主
3月1日晚笔试了2小时,我对Hadoop不甚了解,同时编程第一题暴力求解花费太多时间导致动态规划没有完成,寄 单选题10道,考察计算机网络、JAVA、Hadoop、MySQL等计算机基础知识 简答题3道,考察MySQL索引和优化、Hadoop大数据组件、对游戏指标的解读 编程题3道,一道Z字型变换(参考力扣第6题N字型变换),一道合并区间(力扣第56题),一道动态规划,都是中等难度 主观题2道,了
一面 1.自我介绍 2.最好的项目 3.数据可视化 4.research和find 5.try except 6.数仓的架构 二面 1.自我介绍 2.如何处理异常值和缺失值 3.numpy和pandas平时怎么用于数据预处理 4. pyspark怎么处理缺失值
一面 聊项目 2道sql lead/lag函数 like pandas基础 数据倾斜问题 二面 聊项目 表连接方式 数仓各层作用 数仓建模类型有哪些 维度模型有哪几种 sql执行计划 mr过程 数学建模怎么分工 为什么不读研 数据中台产品了解哪些 已oc #面经#