当前位置: 首页 > 面试经验 >

字节大数据开发实习一二HR面

优质
小牛编辑
87浏览
2023-03-28

字节大数据开发实习一二HR面

5/5一面
5/14 二面
5/18 hr面
5/19 OC

一面(1h10min)

1.自我介绍一下
2.介绍一下你的项目
  2.1 Mysql全量数据规模
  2.2 既然Mysql能存储,为什么要导入到hive中
3.说一下MySQL的ACID特性
4.脏读和幻读分别是什么含义
5.spark持久化的级别和作用
6.spark任务出现数据倾斜有哪些方法解决
7.hive没办法创建分区怎么理解,怎么解决。
8.常见的工厂模式有哪些
9.介绍一下TCP连接,三次握手。
10.为什么要三次握手,如果两次握手会出现什么问题呢?
[算法题]
1.情景题:客户端发送请求,batch数
数组题,面试官手打。
2.判断一棵树是否是二叉搜索树
说一下什么是二叉搜索树。

二面(1h20min)

1.自我介绍
2.深挖项目
  2.1 项目需求
  2.2 最终交付的成果,数据从哪里,对交付方有什么帮助
  2.3 怎么理解数仓建模
  2.4 举一个真实的例子,介绍你负责的项目
  2.5 介绍一下你是怎样建模,为什么要这么建模的。
3. 数据爬取,爬虫是怎么拿到数据的,根据你介绍的聊后续扩充
  3.1 你写一个爬虫,为什么能拿到你想要的数据,中间经历了什么
  3.2 扩展,当你需要爬取的数据量增大,你怎么处理
  3.3 并行爬
4.如果多个任务都在爬取网站,如何保证吞吐量尽可能高的同时不让爬取的网站宕机或任务崩溃(大概是这样)
5.收到大量的url,如何选择任务分发模式(分布式场景)
6.介绍一下MapReduce的过程
7.map端的数据如何保证分发到reduce数据的准确性
8.Java中的集合、类有用过嘛
9.SQL题
很简单的多表查询单列聚合,卡住了没做出来(g)。
10.Linux命令,一个进程很慢,你会查看什么指标,用什么命令去分析,可能是什么原因
11.算法题:链表
链表求和的变式:
leetcode连接

hr面

1.自我介绍
2.实习时间
3.你觉得自己的缺点是什么
4.对前面的面试官评价一下,有什么改进的建议
5.反问环节

#实习面经##实习##大数据开发工程师#
 类似资料: