一面 常见数据结构 维度建模 事实表建模 工作中维度建模是怎么处理 三种事实表的区别 mapreduce原理 hdfs读写流程 增大资源是否会有限制 是否遇到过数据倾斜 二面 数据倾斜 数据治理怎么做的 职业规划 爱好 三面 主题域 数仓建模 bucket join
一面 1.自我介绍? 2.为什么从数分做数开? 3.你觉得数分和数开有什么区别? 4.spark和hadoop哪段实习接触的? 5.讲一下mr和hive原理? 6.hdfs中,一个block大小和通常配置个数? 7.用spark还是用hive?spark比hive好在哪里? 8.spark既然是基于内存的,那么内存不够怎么办? 9.数据倾斜? 10.uid粒度和did粒度用在AB不同的场景是指什么
9.4 一面 1. 介绍实习经历 2. 数据同步 3. 指标分层 4. flink:状态,历史数据回溯、一致性保障、barrier下发、开始做ck的时间点、反压、下游怎么知道上游反压了、解决 5. hbase问题:架构、数据读写、底层文件存储、region划分、regionserver划分(这是啥) 6. jvm内存管理,多线程 7. spark问题:宽窄依赖,算子,shuffle,调优 8. 数
投递的CV岗,C9本硕,low level方向,两篇A一作,无大厂实习 一面 主要在聊论文和项目 比较transformer和CNN的特点 了解哪些生成模型,stable diffusion的原理 手撕分类网络 面完当天约二面 二面 开场手撕海中岛屿数量 聊论文,问提出的方法可以继续应用到哪些领域 因为简历上基本上都是low level相关,所以继续问了对cv其它领域的了解 当天约三面 三面 面试
#面经#一面 8.10 1. 说一说你的项目 2. 对axios的理解; 3. vue3数据双向绑定的原理 4. flex,弹性布局 5. 三栏布局 6. js 的 数据类型 7. 深拷贝的实现方法 a. JSON.stringfy实现深拷贝的缺点 8. 原型与原型链 9. new操作符的原理 10. 闭包 11. 回流与重绘 12. 手撕: a. 手写深拷贝 b. 网络请求并发控制,100个请求
1h10 min 面试官是个大佬,全程面试偏场景题 八股:数仓建模,分层,每层作用,数据倾斜(group by,join)很细,小文件 场景题: 快手在某一时刻某主播开播时流量巨大,然后同一时间段还有多个主播开播 有一些些主播可能粉丝少,但因为在搞活动,把在线列表和主播表join时会发生数据倾斜,这怎么解决 雪花模型用过吗?(用过)讲一个使用雪花模型的场景(多值维度?)面试官说不对。然后只能说没用
1. 自我介绍 2. css盒模型,BFC相关;提了几个场景,外边距折叠的情况 3. 如何实现居中,flex的几个属性代表什么意思 4. 几个定位都说一下 5. js原型链说一下 6. new的过程,发生了什么 7. 数组去重方法 8. 数组扁平化方法 9. promise用哪些用的比较多,all和allSettled的区别 10. 除了promise还有哪些实现异步的方法 11. 浏览器事件循环
写在前面 这是本人去年找暑期实习时候的面经,java后端方向。相关文章链接:快手一面、美团面经、阿里云面经、秋招总结。 面试时长 50min 面试形式 视频面试 面试内容 自我介绍; 项目介绍:参与了哪些项目,面试官挑了一个项目详细展开,要求介绍项目的创新点和难点; 网络相关:介绍下在浏览器输入网址到网页显示,期间发生的事情和涉及的协议?交换机和路由器的区别? 网络相关:HTTP和RPC的区别?分
写在前面 这是本人去年找暑期实习时候的面经,java后端方向。相关文章链接:美团面经、阿里云面经、秋招总结。 面试时长 60min 面试形式 视频面试 面试内容 自我介绍; 实习经历:简单问了问实习期间做的工作,技术栈大概有哪些; Spring相关:解释下什么是IOC和AOP?分别解决了什么问题?IOC和DI的区别? Java相关:Spring AOP的实现原理?JDK动态代理和CGLib动态代理
一面 数据同步怎么做的 事实表、维度表怎么设计 数据完整性、唯一性怎么保证 数据怎么分区,如果增量同步,需要历史数据合并分区慢怎么解决 数仓如何进行组件选型,理由 数仓建设过程中有哪些难点 atlas如何获取数据血缘 拉链表怎么设计 你觉得拉链表常用吗,为什么不用 那你为什么要设计拉链表 sql题 分组topn row_number rank dense_rank区别 看两个sql,差异在哪,哪个
总结:计网基础,扩展的也都是简历上的,最后手撕(可惜我第一次被面试盯着写,很简单的二分查找没写出来,一结束自己复现就秒了😭) 1.自我介绍 2.osi七层 3.http各种请求 4.https握手 5.ssrf 6.psexec和wmiexec 7.日志相关,确实没太了解 8.mimikatz补丁那些(补丁的绕过忘记了没答出来) 9.uac 10.kerberos协议过程,金票银票区别,金票银票
8-3: 自我介绍 实习项目以及实习日常(20min左右) 论文(3分钟左右) 问你对大数据哪个组件比较熟悉 说一下MR的底层原理。。。。。。自己在那不知道从哪里开始说,就从map开始巴拉巴拉到写出数据,自己都讲蒙了。(五六分钟左右) 反转链表,自己处理输入输出以及链表定义(七八分钟),也没给输入输出,就只写了方法体。 先问对hive函数了解咋样,都还行。写SQL:uid,login_time,连
自我介绍 对推荐系统的了解:背景,前景,架构,方法 项目拷打:特征构建,模型选择,评价指标 论文拷打:背景,模型,评价指标 八股(都是从项目和论文中找的点):SVM原理及其推导,LR原理及其推导,XGBoost原理及其推导,XGBoost处理缺失值的方法,模型过拟合的处理方法, 手写:数组中前k个最小的数(类快排)
一、CSS CSS Position定位的各个参数分别是基于什么定位的? 二、JS 你理解的继承是什么? 继承有什么作用? 写demo:Parent类里有name属性和方法,写一个Child类继承Parent类,让Child的实例调到Parent的方法。 一个类的原型对象、实例、构造函数,他们三个的关系是什么? 以Parent为例,写注释标注上述三个具体指的什么?(constructor寄托在谁身
一、自我介绍 二、拷打实习 - 介绍项目 - 功能场景 - 自动化UI测试Selenium - 并发测试 - 接口测试 - 如何提高搜索模块检索效率-ElasticSearch+Redis 三、八股文 - Java多线程实现方式 - Runnable和Callable主要区别 - 线程管理-线程池 - 如何同步线程 - Java中的数据结构 - 线程安全的数据结构 - ConcurrentHash