当前位置: 首页 > 面试经验 >

字节java后端一面

优质
小牛编辑
86浏览
2024-01-30

字节java后端一面

1.自我介绍
拷打之前为啥鸽子
2.项目拷打
3.计算引擎为啥接入yarn做资源调度,不用stanealone直接部署
4.为啥历史状态不用updatestate算子,采用了redis数据库更新状态
5.spark和mr计算引擎的本质区别,计算引擎从mr到tez到spark的一个衍生过程,各个时代的优缺点
6.当同时有海量计算任务在运行的时候,怎么设计计算引擎迁移的方案,怎么平滑迁移,不带来突然崩溃的问题
7.mr引擎迁移到spark引擎时,应该注意考虑到的问题,对具体的任务要针对性考虑什么东西
8.分析分析Influxdb为何适用于时序数据处理的场景
9.讲讲LSM树,HBase和Influxdb的合并有什么区别
10.请你设计一个从Influxdb到Hive的一个数据同步方案,Hive里面的数据模型怎么设计,spark或者flink怎么做并行同步消费,同步数据源的怎么消费,api消费和消费文件效率差距大吗
11.跟着9,如果同时有几百个task在运行,分片方案怎么设计
12.讲讲spark的内存模型,1.6之前和1.6到3.0之间和3.0之后的模型有什么区别
13.spark下各个节点之间是怎么通信的
14.为啥spark这样设计通信模型呢,不采用actor模型会带来哪些问题,多线程做同步可不可以
15.当要对几百个T数据进行排序的时候,spark会不会遇到什么问题,它会怎么样排序的
16.讲讲tungsten细节
17.问了一个spark的qua(?不知道什么东西,没听过)
18.讲讲violate
19.你提到了JMM模型,那你说说你对happen-before的理解,它有8大原则,分别讲讲是什么,还有你怎么理解先行发生这个概念的
20.你还提到了工作内存和主内存,这是JVM下的概念,在操作系统里面工作内存和主内存分别对应什么东西,讲讲
21.你熟悉计网吗,来讲讲拥塞控制的过程
22.在tcp通信中,滑动窗口用在哪里了
23.拥塞控制和流量控制有什么区别
24.在spark设计中,有一个机制和流量控制很像,讲讲那个机制
25.你是考研还是保研的,是考研有专门复习过吗
26.对flink有多少了解
27.有参与过开源社区项目吗
28.最后问几个问题吧,堆和栈访问哪个更快,为啥访问速度有区别
29.讲讲cache,cache和寄存器有什么区别
写题
二叉树路径和
 类似资料: