30min 自我介绍 项目介绍 项目难点介绍 hadoop组件有哪些 hdfs简单介绍 hdfs怎么实现高可用,具体 是哪个进程在zk上注册临时节点 hdfs怎么防止脑裂 hdfs写流程,写到一半client发生OOM之后该怎么办,datanode宕机怎么办 怎么实现nn切换,而客户端无感的 Spark提交作业的流程 Executor内存管理,分别存储什么 spark shuffle有哪些,讲一下
35min 1面 自我介绍 排序算法知道哪些 稳定的排序算法有哪几种 mr和spark的区别 bitmap解释一下 bitmap用途有哪些 布隆过滤器的原理 一道dp题,口述思路没想出来。。。 三道业务场景题 30min hr面 常规hr面 vivo流程真快,爱了,九月底开奖 #大数据开发##大数据开发工程师#
1.自我介绍 2,实习内容 如何实现数据同步 数据同步过程中遇到的问题有哪些 数据同步过后有没有进行验证 你自己设计数据同步系统要注意哪些问题 3,mybatis 与mybatis -plus 的不同之处 4,mysql 怎么优化 对mysql 的看法 5,手撕删除链表的第n个节点 6,jvm了解吗 7,springboot 有看过源码吗 8,动态代理了解吗 感觉不太妙 像是kpi面一样 竟然没有
场景题: 1、有一个sql突然执行很慢有什么原因 2、从一个很大的日志表中10T,随机取出一些数据 3、有两个大表join,我说了分桶排序,他说那大key不还是分到一个桶里面,没解决问题,我说讲大key使用mapjoin或加随机数,那key如果未知怎么办 4、mysql中MyIsam相对于innodb更适合那些场景 5、hashmap为什么不直接用红黑树 问一个问题,回答完就会深挖,给我问麻了 #
9.11 一面(30min) 纯八股: 介绍下hadoop(hdfs、mapreduce、yarn) 介绍下hbase 介绍下flink flink checkpoint、connect和union的区别、flink如何处理数据倾斜 介绍下kafka kafka如果有台机器挂掉会发生什么 链表反转 面试官全程表情和语气冷淡,体验不是很好..当然答得感觉也很一般
1.平常是用python还是java?python和java掌握程度? 2.hadoop的组成,每部分有什么用。 3.spark掌握的怎么样,SQL练过哪些题。 4.mapreduce源码看过吗? 5.wordcount的流程。 6.Scala有没有学过? 然后开始挖简历,还问了我一些业务的问题。 说后面会通知二面,也不知道有没有...
Spark 出问题如何排查 Spark 分区和hdfs block的关系 10000个小文件场景,spark是调整内存配置参数还是调整并行度参数 Spark sql 底层原理 Spark sql如何优化 Hbase region的分裂 #美团#
1h 面试官感觉是个大佬级别人物,battle了40min毕设,理解了项目的细节 sql20min,求某天每个城市所有来访者的人均浏览内容点击量 1.顺带问了timestamp定义细节 2.timestamp和date为什么需要同时存在 3.优化,本身机制优化 4.优化,谓词下推 5.优化,聚合函数结合律子查询下推 反问前辈对大数据的理解
自我介绍; 问实习,尤为问了字节那段,问为什么呆那么久; 为什么面测试开发而不是后端开发; 随便选一段实习,讲遇到的困难及解决办法; 如果现在有个后端和测试开发的机会选哪个? 今天中午审批过了,收到意向书。 我觉得面测开一定要对测试开发有了解,并且能跟其他岗位横向比较来凸显测开的重要性。 写在最后:很多同学最一开始简历挂了或者面试挂了,我想说很多时候,并不是真的大家的学历背景或者什么能力不行。极大
下午四点半打电话问我五点半能面试吗,字节节奏好快,直接就面了 面试形式:下载飞书视频面试 时间:2022/7/18 17:30 0、自我介绍 1、飞书上考了一道SQL,要用窗口函数,case when语句等,写完代码讲思路(解出来了,但面试官提醒我要在外层关联另外一张表,我在内层关联可能会丢失一些数据。没注意到这个小细节) 2、实习相关: 讲一个自己负责的AB test实验分析。 AB test涉
1.项目是自己搞的还是哪里找的 2.项目达成了什么效果,解决了什么问题 3.常见的数仓分为哪几层,为什么要分成这几层 4.项目分层如何做到减少重复开发 5.项目宽表的构成以及和其他表的关联度 6.平常学习通过什么途径 7.MapReduce的原理,秒了 8.国家励志奖学金和校级奖学金的区别 9.学校数模比赛的参赛规模 10.为什么想做大数据这一块 11.为什么做数仓 12.反问 为什么好多都是面完
🕒 岗位/面试时间 前端飞书/2024.3.11 👥 面试题目 进程和线程的区别和联系 进程之间的通信有哪些 输入一个url到浏览器完全渲染出来中间都发生了什么 为什么TCP需要三次握手才能建立连接 大概说一下osi7层模型,每一层是什么,分别做了什么事情 说一下http报文都有哪些东西 get请求会被浏览器缓存吗? url有长度限制吗? 解释一下死锁 如何解决死锁 算法题:在图片里 给出输出
1.岗位:视频架构开发实习生 c++方向 全程90分钟 2.自我介绍然后开始聊项目 项目55分钟 3.八股 c++,区分哪个是指针数组和数组指针 指针常量和常量指针 操作系统堆和栈区别 数据库delete和trancate区别(这个trancate没用过,没说出来) fork函数返回值是怎么实现的(这个看过具体实现代码,就说了下地址) 4.手撕 二叉树前序遍历非递归,撕出来了 5.总结反问 评价如
1.岗位:视频架构开发实习生 c++方向 全程70分钟 2.自我介绍然后开始聊项目 项目40分钟,顺着项目顺便问了一些八股在项目里的实现,例如分布式锁,redis和MySQL数据一致性相关设计(其实感觉项目还能再多聊聊,这样八股问的就可以相对少了,上次就是全程项目) 3.一点点八股 c++虚函数的实现,深挖了一下虚函数表具体怎么在执行的时候找到对应offset的 Linux里的I/O多路复用了不了
基本信息 时间:2023.6.9 时长:70min base:上海 面试岗位:前端 日常实习 问题 你玩得挺6呀,背景都会调 你现在是研二? 你现在是属于实习还是校招呀? 你的实习时间大概是什么时候 你在武汉? 你本科是网络,其实网络也会涉及到计算机相关的吧? 你的前两面整体感觉怎么样?吐槽一下 二面问了原理性东西是吗? 你具体去怎么学习的? 平时怎么去学习前端技术栈的?因为前端迭代得挺快的 平