1、 项目一直挖 2、 Spark调优 3、 Shuffle之类的优化 4、 平常写SQL注重优化之类的问题 5、 第一道题让看下面Java代码写输出。 private static void test(int[] arr) { for (int i = 0; i < arr.length; i++) { try { if (arr[i] % 2
事业群:MEG base:北京 一面:2022.8.12 时长:50min 1. 自我介绍 2. 个人项目,我的项目是围绕着学校课程的项目来的,面试官就让我介绍这门课讲了些什么 3. (学校里)性能测试做了什么工作,性能测试中需要关注什么部分,我从前端和后端分开来讲的 4. 接口测试关注的部分 5. 实习中做的测试工作内容有哪些,这些工作是针对APP吗 6. TCP三次握手,为什么一定要三次握手
2023春招找实习的同学跟我分享了他的面试经历,在这里我进行了一些总结梳理,然后发出来供大家学习 1.自我介绍 2.八股文 你写的这个实时数仓,维表是怎么更新的 flink了解吧,flink里面断流怎么处理 flink的exactly-once是怎么实现的 checkpoint的时候barrier什么时候发送 checkpoint产生了很多快照,怎么进行处理呢 sparkstreaming和str
1、自我介绍 2、跳槽理由 3、介绍团队 4、自己感觉做的最好的项目(扣的很细,聊了很久) 5、遇到过的技术问题 6、数据倾斜如何解决 7、缓慢变化维怎么解决 8、周期变化事实数据,比如七天累计订单表应该放哪一层?为什么? 9、什么数仓才算一个好的数仓 10、雪花模型跟星型模型区别 11、写sql题 12、反问 面了三家 淘天、字节、pdd,都offer了,这个草稿也是当时写的一直忘发了,后面有空
凉经 1.进程调度算法 2.进程通信方式 3.如果一个进程占用系统很多资源怎么定位后端的代码的具体哪部分的问题 4.查看磁盘io命令 5.k8s的认证方式类型 6.k8s pod怎么给apiserver发送信息 7.k8s 扩展CRD组件?没听说过 8.docker实现资源限制和资源隔离底层原理 9.冒泡排序算法 思路 时间复杂度 10.Prometheus如何自动发现主机 11.Promethe
1)10道不定向选择题,共40分,包括知识点: 关系型数据库 有限自动机 进制转化 HIVE特点、复杂数据类型 Flink窗口分类、通过什么方式处理数据迟到、时间语义 SPARK RDD特性 LSM 2)1道数据库,给出一个表,包括三个小题: 1. 玩家在线时间排名 2. 计算 pv, uv 3. 计算第一天留存率 3)2道编程题,题目描述中有说 若写不出来 也可以在注释中写思路或伪代码 1. J
一面时间:2022.10.13 星期四 10:30-10:45 和HR聊天比较多 自我介绍 是否了解就业地点? 兴趣爱好 优缺点是什么? 现在有没有女朋友?(???这都要问,哈哈哈) 是否考虑考研?为什么? 大学期间参加过什么项目?简单介绍一下 面对一个新技术怎么去学习? 大学期间最后悔的事? 期望薪资是多少? -------------------------------------------
【字节提前批-大数据开发工程师-Data 一面】 0 面试官自我介绍,介绍面试流程 有些奇怪的是 首先提到这个岗位不是xxx(记不清原话),偏向开发,询问是否能接受,当时我的理解是:可能这个岗位偏向大数据组件的开发,而我简历里没提及java,所以面试官想知道我是否还愿意继续面试该岗位? 随表示接受 1 自我介绍: 学校,专业,目前的实习单位和岗位,在校项目简述 2 对实习参与的项目的展开介绍:我实
无心插柳柳成荫,随便投的厂子,没想到好像是最适合,聊的最好的一家。时间太久了,回忆的面经缺失内容会比较多。 收到意向书的同学可以加意向群:640262555 备注意向岗位即可 timeline: 10.11 一面 一小时 部门内大哥 10.14 笔试 一小时 10.21 二面 一小时 部门leader 10.26 三面 半小时 团队大boss 11.7 hr面 半小时 11.15 意向 面试流程
面的是团子的金融部门,挺感兴趣的,记录一下二面问题 1.说说你做的两个项目(一个离线数仓一个flink) 2.你挑一个详细说说吧(面试官笑,当时感觉有点不妙了,,,觉得面试官啥都能问,我说了flink) 3.说说watermark机制 4.说说checkpoint机制 5.说说exactly-once是怎么实现的 6.了解反压吗(了解) 7.你觉得hadoop和spark差别在哪 8.你对实时更感
笔试题回忆版 一简答题(30分) 1 对远程linux/unix系统进行远程操作,通常的途径是采用终端软件通过ssh登陆远程系统进行操作,但是在网络发生中断时,Linux/unix端运行的程序将会中断。 请阐述这种问题发生的原理、通过何种路径可以避免这种问题、以及阐述可避免这种问题发生途径的原理 2 最小堆 插入,删除 编程实现。 3 不太记得了。 二算法与程序设计(40分)(算法可以使用伪代码描
自我介绍 项目中有什么难点,怎么解决的 内存布局(具体到每个区在内存中的顺序) 堆区、栈区的区别 虚拟内存与物理内存的区别 虚拟内存的大小有什么限制,举个例子 开发时如何避免内存泄漏 百万级行代码项目出现内存泄漏如何定位,答:第三方库 这个第三方库的实现原理知道吗(自己给自己挖坑😭),如果让你自己设计一个内存泄漏检测工具,你会怎么做(会个der) c++的多态是怎么实现的 基类和子类的虚函数表是
7.16同时发的测评和一面邀请 7.19一面,一个小时左右,期间面试官顺着简历问,实习内容细节问了很久,然后是八股,似乎是没有准备八股题目,按着stl标准库问各个模板的实现 1. vector的实现,queue的实现,priority_queue的实现 2. 解释下泛型,泛型的好处 3. 什么时候需要线程同步,为什么需要多线程 4. 线程同步的实现(答mutex、guard_lock、cv、全局单
ps:(我在他们子公司实习了1年) 自我介绍 子公司实习工作内容 介绍论文方向,稍微提问了一下 对东电了解吗 根据简历提问: 数据湖和数据仓库区别,优势 自己搭建过数据湖吗 (简历没写专科经历, 中途hr突然问我专科在哪上, 高考分数) 总结:挺轻松的,面试了大概30分钟,但是感觉面试这个公司目前没有真正的大数据团队,只有算法和开发团队, 听面试官意思是领导近期想组建大数据团队,所以开始招人。 纠
mapreduce中有哪些排序 yarn的事件驱动 hbase写热点问题 建表时怎么指定空region spark sql中dataframe怎么把表中的字段提取出来 hive怎么提取出来 yarn中的container怎么实现 写一个sql,学生不同学科的得分排名前三 手写单例模式,策略模式,工厂模式,并描述在什么场景下使用,口述一下装饰者模式 arraylist和linkedlist的区别,什