这轮比较关注底层
1.自我介绍
2.个人信息和实习时长进一步沟通
3.问项目,进一步阐明下项目细节
4.HDFS备份文件数量
5.HDFS读文件底层原理
6.HDFS写文件底层原理
7.追问是写完一个文件就返回还是所有备份写完才返回
8.问MapReduce原理
9.问Hive内部表和外部表的区别
10.问Hivesql咋转换到MapReduce的
11.问Hive可以用啥作为元数据库
12.Hive和HDFS的底层架构的关系,什么地方用到HDFS
13.问了对资源调度了解多少(提了yarn,没深入学习过)
14.问Mysql索引用啥,为啥用B+树
15.问各种连接方式的区别
16.问平时用到的集群是用现成的还是自己搭建(虚拟机里面搭建集群)
SQL出了两道题,最开始出了道一个city列中数据格式是(南京,北京,深圳)这样的,求内连接的结果。。想了一会说不会,city列改成了(南京)这样只有一个城市名称的数据格式,直接内连接就行。
算法,问一个排序数组有一个数重复了,求重复次数。时间紧先写了循环遍历,然后说了二分查找的思路。
#字节跳动大数据开发面经##字节跳动商业化##字节跳动日常实习##字节跳动面经#