在牛客的第一条面经。菜鸟一枚,大佬轻喷 😥 单纯记录一下吧,既方便以后自己复盘,同时也希望能为以后投递元气的吴彦祖刘亦菲们做个参考8~ 背景:DS硕士在读,世界500强快消一年运营数据分析工作经历 一.hr约时间 二.业务一面(约36分钟) 1.自我介绍 2.工作经历中数据分析的指标有哪些?有哪些公式? 3.熟悉哪些分析模型?能结合实际的工作展开讲一下吗? 4.进销库存的管理优化是怎么实现的?(
2022/06/15 一面 35min 1:介绍项目 2:数仓分为几层?每一层作用? 3:数仓分层的意义? 4:flume导入数据到HDFS 为什么中间加kafka? 5:项目中可视化用什么做的? 6:SQL题 一列为日期 一列为金额 按月统计金额总和 7:MapRedcue原理 8:MapReduce的三个阶段 9:研究生上的课 10:接触过实时的大数据业务吗? 反问:部门技术栈 ?实习的话
一面 17min 面试官是个挺和蔼的大叔 1:大数据竞赛2:队伍分工做了哪些事情 3:数据特征工程怎么做的 4:特征工程是否凭主观经验来判断?还有什么其他方法? 5:数据量特别大怎么去选择有用的数据 6:数据分析或者说数据工程对公司的影响 7:除了python还有其他擅长的语言 8:实习在做什么 9:哪里人?10:反问:工作主要是做什么方面,需要接触机器学习和信息加密吗? 新人进去培养机制? --
2022/08/01一面 25min 两个面试官 项目介绍一下 大数据比赛集群搭建过程 Hadoop端口号 有哪些配置文件 Hadoop切片 hive和关系型数据库区别 内部表外部表 项目中用的是外部表还是内部表 flink和spark区别 rdd是什么 spark stage怎么划分 spark分区数怎么确定 类加载机制 索引越多越好吗 lock和synchronize ------------
一面 35min 面试体验很好 主要挖项目和实习经历 英语好 来段英文自我介绍 喜欢打篮球吗 项目介绍一下 项目中每一层做了什么任务 用户宽表和其他宽表有没有考虑过数据口径一致性问题 数仓分层 数据仓库是什么 怎么看待数仓分层 未来求职规划是数据开发和数据科学(与算法结合) 联想用的微软的大数据框架能接受吗 实习在做什么 工作更想做技术型还是底层型 求职时看重公司的什么 比如联想和阿里你会从哪些方
找了半个月的实习,面试了20多家,在同程HR面之后还被挂的惨痛经历之后,终于找到了一家不错的公司。(现在大环境下大数据实习太难找了,基本都是外包要人,BAT我都是一面挂,有些是简历挂) 下面讲讲我记得的一些问题 一面(40分钟) 自我介绍 熟悉二叉树吗,细说有多少种二叉树,哪些二叉树是用来排序的,并且将各个树的特点讲讲 了解MySQL存储引擎嘛,说说自己看法 计算机网络,TCP,UDP区别。Htt
2022/08/13 一面 时长15min 感觉啥也没问 自我介绍 项目主要是大数据相关,你对算法方面了解多少 实习在做什么 想做偏算法还是偏数据的工作 如果其他部门提的取数需求做不了 你会怎么做 面试官介绍他们的电池时序数据 反问:业务部门多少人,入职后做的工作偏算法还是数据 ------------------------------------------- 2022/08/13 面试刚结
部门:网易云 8.23约面,8.25 一面 8.29 二面。8.30 hr面 一面: 45min左右 1.自我介绍 2.说说项目用到了哪些技术 3.你刚刚说到了即席查询,项目里是怎么做的。 4.四道sql,十分钟后对答案 5.笛卡尔积了解吗。 6.笛卡尔积会产生什么问题。 7.你刚刚说到了数据倾斜。介绍一下。 8.笛卡尔积就会产生数据倾斜吗 9.mr流程介绍一下 10.你多久能来实习 11.你刚刚
9.19号 录用通知 - 9.13号性格测评 - 9.9号一面 一直等待进面试,场控30小时才开始 三个面试官 群面 1.自我介绍一分钟 2.为什么工作后考研 3.项目提问 4.大数据项目中的项目架构 5.flume拦截器思路 6.算法归并排序思路 7.家人情况 8.未来职业规划 问的都比较简单,不难 搞了个23届湖南联通数科群,私我进#湖南联通##联通数科##大数据开发工程师##秋招##面经#
本人面试的是数据开发岗 一面: 面试官问我是面数据还是开发,如果是开发的话给我换个面试官。最后没换就面数据了。 1.写一个阶乘的题 比较尴尬的是忘了0的阶乘是1了 2.sql一道行转列的题,思考了一会,还是写出来了 3.快排 写完以后说思路 4.给了一个hive sql的语句,问这条语句执行,到最后转换为mr的全过程。基本上都答上来了,group by在mr的实现答的有点小问题,但是还是给我过了。
2022/09/06 一面 50min 实习在做什么 介绍一下实习项目 你在这个项目做了什么 为什么用click house click house库引擎 表引擎 click house优缺点 DataX什么作用 数据倾斜 spark有用过吗 小文件怎么处理 spark任务慢怎么查看问题 RDD说一下 spark宽依赖 spark application job stage task的关系
09.04 投递 09.07 一面(hr面) 常见的HR面问题(一共15min) 自我介绍,公司了解,行业期待,职位看法这些东西吧 09.13 二面(专业面试) 讲了讲项目 讲了讲方法。反问了一下他们是怎么做失效的(感觉atl没弄懂什么叫失效分析) (面试过的里面相对简单的,差不多20min?) 09.17 测评(无聊) 证明你是一个正常人系列 09.19 谈薪 坐标厦门 base 9750 听到
一面 30min 两个面试官 一个问技术 一个问综合 自我介绍 比赛经历 比赛中Mapreduce写了哪几部分代码 实习项目说一下 实习任务分工 Kafka生产者消费者说一下 有什么主要的参数 一个SQL题目,要求根据经度纬度输出地点 场景题写一个spark代码 反问 ------------------- 2022/09/22 电话沟通意向 已拒绝 工作地点在宁波 #吉利控股##我的秋招记录#
问题: ·问了一下实习和项目 ·哪些数据库有跳表这个基础类型 ·c++类的缺省函数4个有哪些 ·new、delete、malloc、free区别 ·讲一下虚函数的作用 ·进程线程区别 ·介绍一下数据库事务ACID ·介绍一下数据隔离级别 ·讲一下hash索引和b+树索引 ·临时表了解吗 编程题: ************ (和去年的面经一样,我提前准备过) Q&A: 面试流程 对于HTAP的看法
已OC,评论区有意向群大家可以加入交流 一面: 挺走流程的,项目+八股+性格 二面: 项目+做题+性格,题目是一个实时指标,一个离线指标,居然要求在web上写flink,然我选择用SQL写离线,题目是统计一个直播间的最大在线人数,感觉挺好的,但是说方向偏业务,问了我的意向,我没表达出兴趣。 三面: 1.自我介绍 2.项目介绍 3.Hudi项目难点 1).FlinkJob怎么配置采集表的个数:个数太