一面 1.自我介绍? 2.为什么从数分做数开? 3.你觉得数分和数开有什么区别? 4.spark和hadoop哪段实习接触的? 5.讲一下mr和hive原理? 6.hdfs中,一个block大小和通常配置个数? 7.用spark还是用hive?spark比hive好在哪里? 8.spark既然是基于内存的,那么内存不够怎么办? 9.数据倾斜? 10.uid粒度和did粒度用在AB不同的场景是指什么
排队十分钟面试五分钟 自我介绍 数据倾斜 数仓分层 有没有在看其他金融银行 选择银行的原因 “看来你掌握的不错,今天的面试到此结束吧,注意查收笔试”
9.4 一面 1. 介绍实习经历 2. 数据同步 3. 指标分层 4. flink:状态,历史数据回溯、一致性保障、barrier下发、开始做ck的时间点、反压、下游怎么知道上游反压了、解决 5. hbase问题:架构、数据读写、底层文件存储、region划分、regionserver划分(这是啥) 6. jvm内存管理,多线程 7. spark问题:宽窄依赖,算子,shuffle,调优 8. 数
1h10 min 面试官是个大佬,全程面试偏场景题 八股:数仓建模,分层,每层作用,数据倾斜(group by,join)很细,小文件 场景题: 快手在某一时刻某主播开播时流量巨大,然后同一时间段还有多个主播开播 有一些些主播可能粉丝少,但因为在搞活动,把在线列表和主播表join时会发生数据倾斜,这怎么解决 雪花模型用过吗?(用过)讲一个使用雪花模型的场景(多值维度?)面试官说不对。然后只能说没用
阿里云: 1.EXCEPTION和Error的区别,可以抛出自制的Error嘛,会被捕获嘛(都实现自Throwable) 2.HashMap可以保存null key或者value嘛, 3.ConcurrentHashMap可以存null嘛,为什么不可以 原因:设计者的设计问题,以及二义性 4.Spring中事务的隔离传播方式默认为? 5.两个事务中,一个事务A调用事务B,此时B回滚了,A会不会回
1. 匿名面试,首先是自我介绍。 2. 项目问题 * Redis 的模式 * 有了Redis 为什么还要有 MySQL 3. C++知识 * 两个C++小例子,问输出(如图) * 虚函数的底层原理 * 哪些函数不能被用作虚函数 * 构造函数可以用作虚函数吗 * 什么情况下会有野指针的情况发生 * define 和 inline 的区别 * map和unordered_map的区别 * map中如何
30min 问简历 快速排序 场景题:十亿个数怎么排序,十亿个double需要多少内存(算成GB,1亿个数怎么排序 研究生方向和项目 反问:今年招的人多不多。-不多,今年看到的简历是过去五年最好的(我人麻了 主要工作内容。-数仓搭建,开发相关,数据分析相关
🤔面试感受还不错,两位面试官很和蔼,但是自己表现得一般,全程围绕项目问问题,没问太多八股。 1、自我介绍 2、问了科研方向,扯了三四分钟 3、问项目功能、技术栈 4、索引不命中的情况(不会,扯了索引失效) 5、项目里用到的索引 6、redis可以存储不同结构的数据吗 其他的都是一些项目里的场景,还延伸了场景问我应该怎么实现 基本上除了项目怎么实现都没太答出来,要么就是说错,唯一的安慰就是多少都能
一面:投的数研,实际数科 1.自我介绍 2.实习内容 3.实习团队架构 4.map reduce原理 5.数据倾斜有没有遇到过?怎么解决 6.ab实验原理、流程、如何分析 7.假设检验原理 8.口述sql题目:求连续登陆三天的用户 9.假设检验概率论场景题:求置信区间 10.常用的机器学习算法 11.随机森林原理 12.求职意向,数科还是数研,安排下一轮面试官(回数研后第二天结束流程) 13.反问
一面 数据同步怎么做的 事实表、维度表怎么设计 数据完整性、唯一性怎么保证 数据怎么分区,如果增量同步,需要历史数据合并分区慢怎么解决 数仓如何进行组件选型,理由 数仓建设过程中有哪些难点 atlas如何获取数据血缘 拉链表怎么设计 你觉得拉链表常用吗,为什么不用 那你为什么要设计拉链表 sql题 分组topn row_number rank dense_rank区别 看两个sql,差异在哪,哪个
边缘计算的概念介绍一下 查找两个链表是否有公共节点过程 C语言中堆 栈的区别 局部变量占用内存较大 ,可以在栈中分配吗 堆空间管理如果操作不当会出现什么问题 memcpy介绍一下,几个参数 memcpy_s介绍一下 C++中避免内存泄漏的方式 sizeof一个指针大小时是多少 两个int类型 相加,如何设计两个数相加后的数据类型 结构体int,char类型的如何布局 union联合体int,cha
1. 自我介绍 2. python八股: 元祖和列表的区别 python区分大小写吗 装饰器 闭包 3. 常用Linux命令,使用的Linux系统,怎么查看文件内容,vim,传输文件用什么协议,scp和cp有啥区别 4. 计网:三次握手,tcp和udp区别 5. 一些闲聊,感觉自己啥也问不出来给面试官不知道问啥了 6. 用过的排序算法,讲讲堆排序 7. 反问,国庆前结束 自己太菜咧,脑子一短路,啥
1.自我介绍 2.项目是否落地 3.介绍个带仿真环节的项目,你主要做了哪些工作 4.如何进行仿真 5.仿真指标有没有标准,仿真过程中模型有什么不足吗 6. 你的这个仿真结果符合实际吗 7. 模型的输入信息是什么 8. 研究方向有什么实际应用吗 9.数据集里的数据如何处理 10.预测是怎么考虑的其他因素,比如驶出,驶入。 11.模型如何优化 12. 为什么没实习 13. 为什么来应聘系统测试这个岗位
8-3: 自我介绍 实习项目以及实习日常(20min左右) 论文(3分钟左右) 问你对大数据哪个组件比较熟悉 说一下MR的底层原理。。。。。。自己在那不知道从哪里开始说,就从map开始巴拉巴拉到写出数据,自己都讲蒙了。(五六分钟左右) 反转链表,自己处理输入输出以及链表定义(七八分钟),也没给输入输出,就只写了方法体。 先问对hive函数了解咋样,都还行。写SQL:uid,login_time,连
(系统测试) 1.自我介绍,介绍一下自己的专业 2.具体展开讲讲自己的项目 3.介绍一下你所提到的神经网络,在论文和项目里都有什么作用 4.你在这些项目里的角色 5.你的研究方向在实际中的应用 6. 算法题: 搜索二维矩阵 除了行列遍历,还有其他方法吗? 7. 介绍公司以及部门业务 8. 对武汉的想法 9. 能不能提前出来实习 反问: 部门业务 共41分钟