一面 40min 0914 没有问任何八股,主要还是围绕抖音的数仓建设、架构优化、日常业务展开。 关于为什么不具体写数仓建设与架构优化方案,一来是每个公司并不相同,没有可参考性,拿最简单的分层,每个公司的分层都不一样,所以没有在面经中展开这些相关信息。二来这本身属于公司内部信息,没法在平台上展开讲。 #数据仓库与数据分析实习##秋招##秋招面经##2023秋招#
一面 40min 0919 不记得问了什么,大致好像是围绕目前的实习展开。 二面 40min 0920 努力回忆一下,问了一些八股 1. 为什么划分宽窄依赖? 2. Checkpoint和Persist? 3. MR过程? 4. 为什么Spark比Hive快?(这其实不合理,一个计算引擎和一个数仓工具,没法比较,面试官应该想问的是Spark和Hive的默认MR引擎吧,然后按照这个方向回答的) 5.
社招岗位,问我能否去实习,一些基础知识,反问具体做什么,看到给的很高,但公司成立资本仅50w,我不太懂 自我介绍,项目介绍 确认岗位,能否实习 基础问题: 集成模型 什么是过拟合,如何解决? SVM优缺点 树模型的了解 反问: 公司做什么? 有消息再联系 #秋招##上海#
一面 30min 仍然记不得了,努力回忆一下 实习数据有多大? 这么大的数据量需要多少资源? 多线程的三要素? Java的内存模型? 宽窄依赖? Spark为什么快? Spark的Shuffle有几种? (不记得了 二面 20min 用ES或者HBase跟用Hive有什么区别? 怎么技术选型? 总结:是吉利下面的子部门,主做出行方面数据,数据量较小,且人员较少。 #数据仓库与数据分析实习##秋招#
9.19 渤海一面(共 35min) 银行问的小难,四个面试官,从数据挖掘,c++,再到linux,最后HR base哪里,最后选天津 为什么投银行,还投了哪些? 自我介绍,项目介绍 数据挖掘内容: 项目里的数据挖掘是什么? 解释下xgboost和lightgbm的区别? lightgbm可以并行吗? L1和L2的区别? AUC的物理意义? 任取一对(正、负)样本,正样本的score大于负样本的s
基本不问简历,偏业务和基础知识 1.认为数据分析在行业中的作用 2.sort by和order by的差别 3.采用调研的方式效率低、成本高,怎么从数据角度分析 用户画像哪些维度(结合信贷业务) 4.对abtest有什么了解 5.为什么会产生过拟合的情况如何解决 #度小满##面试##数分#
9.22 线下群面,早上面完下午就收到测评 9.26 收到二面通知 9.28 二面 9.29 感谢信 9.28 二面 自我介绍 科研项目介绍、科研项目中存在哪些问题和瓶颈? Mapreduce 和 Hadoop 的工作原理、区别和联系? 旋转链表如何实现?(很简单的一个问题,一直和我扣细节纠结好久....) 反问 #美的##凉经#
二面凉了,总结一些经验积德吧hh。大家在面试的时候还是要自信些,具体表现在: (1)少说一些“可能”“emmm“的话 (2)即使心虚,也要对自己的回答表现出一幅胸有成竹、运筹帷幄的样子 (3)被问到不会的问题,尽力表现,起码说明白自己的思路或者决心 -- 有的面试场景可以虚心请教,有的时候。。就加油吧 【Timeline】 8.11投递 --> 8.27笔试 --> 9.6-9.7一面 --> 9
1面:写题目easy+问基础知识+抓只线程池一直问到了系统资源分配,解答部门做大数据的解决方案,不涉及开发 2面:写题目easy+问简历,全程我在讲,然后没了,反问对我的了解,还说部门主要做解决方案 3面:聊人生,主管很好,推荐一下解决方案部门,感觉主管很年轻,然后给了我意见说做非技术不一定不好,校招生不要带着偏见。 整体:3面都是我单方面开摄像头,整个流程很简单,主管面也挺好的,唯一就是不搞技术
三轮面试,进度很快,一周内结束。 第一轮,hr面试 问一些基本情况,8分钟结束。 第二轮,技术面 项目竞赛,过拟合怎么解决,特征筛选方法等等, 12分钟。 第三轮,终面+签约 问了一些基本家庭情况,职业规划等等。面试官长的有点像我初中同学,亲切感倍增。 然后hr介绍薪资。 20w左右薪资,单人单间免费住宿一年,八险二金,房补2500,食堂早中晚分别3,7,7元自助餐,电话网络全免费,感觉不错。 #
9.20 24届非科班本发面筋攒好运! 第一次面+太紧张+基础不好+算法出没见过的hard = 寄 组是偏基础架构的 自我介绍到一半简介项目的时候就被打断了开始撕项目(乐 学习的方法 离线项目: 1.分层的好处,为什么分层 2.idmapping 3.拉链表的逻辑(用户活跃区间的中间表),下次还应该解释一下这个中间表的好处以及为什么方便。 实时项目: 1.维表动态注入的意义在哪里,为什么不直接写入
一面简单介绍项目,操作系统锁机制,线程进程,然后文件系统,文件传输协议,硬连接软连接。基本不问项目,全部是操作系统问题。 二面简单自我介绍,然后手写阻塞队列(真的忘记怎么阻塞了),然后用户态和内核态,询问一些内核态细节。不会。。。然后草草结束 三面,以为g了,但是三面主管问的都是生活问题,这个我熟,答的很顺畅,然后通过进池子了。仅是多了一丝念想。 #华为面试#
面试时长18分钟,问的问题很基础,还是看简历或者学历下菜吧 1、学大数据学了多久,我说今年1月开始学的,他说这么短的时间能明白吗?这8个月还能一点都学不明白吗? 2、问了下实习内容,没深挖 3、hdfs的高可用,太紧张把namenode说成nodemanager了,后来才反应过来,就这个问题回答的有问题 4、hive的窗口函数 5、hive和rdbms的区别 6、hive的调优方面 7、spark
面麻了 大概率凉 团队是数据中台(?其实没听清) 主要做的工作是实验方法/评估的改进及推广 岗位是数据分析 但是更偏向数据科学 但是对于AB实验要求很高 要了解因果推断 AB实验/统计学基础/业务思维缺一不可(没有手写sql) 1. 自我介绍 2. 介绍一段经历 有追问 会直接点出问题 反思:对于实习的经历不仅要非常熟悉且知道问题在哪/有无改善空间 有一点比较好玩 lz这段经历给n个面试官讲过
前言 星环感觉整个流程非常不错,二面面试官不是搞大数据的,但是交流上感觉到了尊重,面试实在7月份,八月份就给意向了,进展到十月份了对比看来星环流程真的不错(PDD推荐组某个面试官一生黑),看到大数据后端已经不招人了,但是可能会拒掉 一面 忘记了没有记录 二面 1.1. HBASE架构 1.2. Regionserver结构 1.3. Hbase避免热点数据(Rowkey的设计) [大白话彻底讲透