字节java后端一面

优质

小牛编辑

96浏览

2024-01-30

字节java后端一面

1.自我介绍
拷打之前为啥鸽子
2.项目拷打
3.计算引擎为啥接入yarn做资源调度，不用stanealone直接部署
4.为啥历史状态不用updatestate算子，采用了redis数据库更新状态
5.spark和mr计算引擎的本质区别，计算引擎从mr到tez到spark的一个衍生过程，各个时代的优缺点
6.当同时有海量计算任务在运行的时候，怎么设计计算引擎迁移的方案，怎么平滑迁移，不带来突然崩溃的问题
7.mr引擎迁移到spark引擎时，应该注意考虑到的问题，对具体的任务要针对性考虑什么东西
8.分析分析Influxdb为何适用于时序数据处理的场景
9.讲讲LSM树，HBase和Influxdb的合并有什么区别
10.请你设计一个从Influxdb到Hive的一个数据同步方案，Hive里面的数据模型怎么设计，spark或者flink怎么做并行同步消费，同步数据源的怎么消费，api消费和消费文件效率差距大吗
11.跟着9，如果同时有几百个task在运行，分片方案怎么设计
12.讲讲spark的内存模型，1.6之前和1.6到3.0之间和3.0之后的模型有什么区别
13.spark下各个节点之间是怎么通信的
14.为啥spark这样设计通信模型呢，不采用actor模型会带来哪些问题，多线程做同步可不可以
15.当要对几百个T数据进行排序的时候，spark会不会遇到什么问题，它会怎么样排序的
16.讲讲tungsten细节
17.问了一个spark的qua（？不知道什么东西，没听过）
18.讲讲violate
19.你提到了JMM模型，那你说说你对happen-before的理解，它有8大原则，分别讲讲是什么，还有你怎么理解先行发生这个概念的
20.你还提到了工作内存和主内存，这是JVM下的概念，在操作系统里面工作内存和主内存分别对应什么东西，讲讲
21.你熟悉计网吗，来讲讲拥塞控制的过程
22.在tcp通信中，滑动窗口用在哪里了
23.拥塞控制和流量控制有什么区别
24.在spark设计中，有一个机制和流量控制很像，讲讲那个机制
25.你是考研还是保研的，是考研有专门复习过吗
26.对flink有多少了解
27.有参与过开源社区项目吗
28.最后问几个问题吧，堆和栈访问哪个更快，为啥访问速度有区别
29.讲讲cache，cache和寄存器有什么区别
写题
二叉树路径和

字节java后端一面

热门公司

相关阅读

推荐文章

推荐题库

推荐问答