一面 1.自我介绍? 2.为什么从数分做数开? 3.你觉得数分和数开有什么区别? 4.spark和hadoop哪段实习接触的? 5.讲一下mr和hive原理? 6.hdfs中,一个block大小和通常配置个数? 7.用spark还是用hive?spark比hive好在哪里? 8.spark既然是基于内存的,那么内存不够怎么办? 9.数据倾斜? 10.uid粒度和did粒度用在AB不同的场景是指什么
排队十分钟面试五分钟 自我介绍 数据倾斜 数仓分层 有没有在看其他金融银行 选择银行的原因 “看来你掌握的不错,今天的面试到此结束吧,注意查收笔试”
9.4 一面 1. 介绍实习经历 2. 数据同步 3. 指标分层 4. flink:状态,历史数据回溯、一致性保障、barrier下发、开始做ck的时间点、反压、下游怎么知道上游反压了、解决 5. hbase问题:架构、数据读写、底层文件存储、region划分、regionserver划分(这是啥) 6. jvm内存管理,多线程 7. spark问题:宽窄依赖,算子,shuffle,调优 8. 数
1h10 min 面试官是个大佬,全程面试偏场景题 八股:数仓建模,分层,每层作用,数据倾斜(group by,join)很细,小文件 场景题: 快手在某一时刻某主播开播时流量巨大,然后同一时间段还有多个主播开播 有一些些主播可能粉丝少,但因为在搞活动,把在线列表和主播表join时会发生数据倾斜,这怎么解决 雪花模型用过吗?(用过)讲一个使用雪花模型的场景(多值维度?)面试官说不对。然后只能说没用
30min 问简历 快速排序 场景题:十亿个数怎么排序,十亿个double需要多少内存(算成GB,1亿个数怎么排序 研究生方向和项目 反问:今年招的人多不多。-不多,今年看到的简历是过去五年最好的(我人麻了 主要工作内容。-数仓搭建,开发相关,数据分析相关
一面:投的数研,实际数科 1.自我介绍 2.实习内容 3.实习团队架构 4.map reduce原理 5.数据倾斜有没有遇到过?怎么解决 6.ab实验原理、流程、如何分析 7.假设检验原理 8.口述sql题目:求连续登陆三天的用户 9.假设检验概率论场景题:求置信区间 10.常用的机器学习算法 11.随机森林原理 12.求职意向,数科还是数研,安排下一轮面试官(回数研后第二天结束流程) 13.反问
一面 数据同步怎么做的 事实表、维度表怎么设计 数据完整性、唯一性怎么保证 数据怎么分区,如果增量同步,需要历史数据合并分区慢怎么解决 数仓如何进行组件选型,理由 数仓建设过程中有哪些难点 atlas如何获取数据血缘 拉链表怎么设计 你觉得拉链表常用吗,为什么不用 那你为什么要设计拉链表 sql题 分组topn row_number rank dense_rank区别 看两个sql,差异在哪,哪个
8-3: 自我介绍 实习项目以及实习日常(20min左右) 论文(3分钟左右) 问你对大数据哪个组件比较熟悉 说一下MR的底层原理。。。。。。自己在那不知道从哪里开始说,就从map开始巴拉巴拉到写出数据,自己都讲蒙了。(五六分钟左右) 反转链表,自己处理输入输出以及链表定义(七八分钟),也没给输入输出,就只写了方法体。 先问对hive函数了解咋样,都还行。写SQL:uid,login_time,连
第一次写面经 快手音视频部门 感觉技术挺好就接了 一面 6.13 主要问了Flink的相关问题以及实习的流批一体项目 具体问的Flink问题就是数据倾斜、反压以及状态后端、checkpoint相关 面试的时候面试官提了个flink相关的名词 问我了解过吗 表示从没听说过 面试官说问题不大 具体细节问题忘记了 然后就是jvm、多线程相关的知识 这部分答的不好 没咋看java 最后就是两道算法 二面
技术一面 1,自我介绍 2,做过最难的一个功能模块,遇到最难的问题 3,现场做一道设计题,比较T1,T2两个表的数据,找出ID相同的数据(1)数据大小256M;(2)数据大小为4G; 4,面向对象的特征,如何实现多态。
🧐背景:211交通工程出身,读研转到本校航运学院,做船舶交通大数据挖掘,涉及机器学习。 🧐自身情况:sci在投,一篇会议论文接受,一个专利发表。 🤐一志愿是九月初的技术支持工程师,因为后知后觉,发现不懂网络协议,没参加笔试。 👾10.25投大数据算法,以交通认知方向。笔试主要是机器学习内容,选择题,问答题,以及一道编程。 👾11.7日收到电话面试,讲了一下基本情况。 👾11.8日一面技
23春招,base广州,网上给的内推码,c9本 网申仅给了简历 笔试完成,一小时15单选,3不定项,3编程,选择题难度偏高,编程题简单,第一道ac,第二道很奇怪案例过了提交0,第三道83%,时间太少,很赶所以也没时间细想 3.16下午一面完成,两个面试官,一个hr一个技术,技术面很循序渐进,问课程,从课程入手开始问csapp,问c语言的从c文件到exe文件的整个过程,问项目,问c++的书看过那些,
6.2投递 6.6测评,当天下午约一面时间 6.10一面 6.15二面 一面。技术➕hr 问了项目相关,项目代码量, MySQL中的锁 为什么来青岛,为什么选择海尔,职业规划 二面 技术➕hr 没问项目,没问八股,问了职业规划, 为什么选这个岗位, 如何和同事沟通协调,和上级沟通 提前批第一个offer,对于我这个非科班小白来说更多的是信心鼓舞。 加油,秋招继续冲!
面试官讲了下工作有研发也有工程落地,所以后面问的关于开发的东西多一些。 1. 数据结构,有序二叉树插入的时间复杂度,数组插入的时间复杂度 2. 两个数组(集合),如何比较是否相同。一开始说要排序,后面想着遍历一下用哈希表存一下,再遍历哈希表应该可以。 3. c++的题,sizeof() 4. 如何判断浮点数等于0,我说abs(f) < epsilon。 5. 关于补码,为什么要使用补码 6. 面向
4月20号下午三点约的电话面试。 技术面问题 自我介绍,介绍下最近做的一些项目。 详细介绍一下项目(主要是后端)有哪些模块,怎么设计的,之间的通信是怎样的? 实现对Word或者Excel读写功能时,有没有遇到过比较占内存的问题?你是怎么解决的? Apache POI中也有解决内存溢出的方法,有去了解过吗? 有了解过分布式吗? 简单介绍一下Spring里Bean的初始化过程。 Spring里解决循环