当前位置: 首页 > 面试经验 >

大数据实习面试记录

优质
小牛编辑
97浏览
2023-03-28

大数据实习面试记录

#数据人的面试交流地#
十方融海 大数据开发实习生(秋招提前批)
一面:2022/05/30
自我介绍
this super
值和引用
垃圾回收算法
多线程用过吗
回收算法 进程线程
Linux子系统:
linux内核的子系统有5个:
1、 进程调度控制系统(SCHED);
2、内存管理系统(MM),主要作用是控制多个进程安全地共享主内存区域;
3、虚拟文件系统(VFS);
4、网络接口(NET);
5、进程间通信(IPC)。
hadoop架构
项目流程
网络七层
冒泡排序的时间复杂度
prim算法
索引种类 和 类型
开启一个mr分配多少内存
反问
二面:2022/05/30
自我介绍
索引页的实现
一亿数据在b+有多少页,多少层
一亿数据的id,怎么随机找到一个id 答:bitmap hash
一亿数据的top100
索引种类
为什么用B+树
上传小文件到hdfs上,计算机网络、操作系统的流程
mr join的流程
Linux内存不够怎么查看 查看物理内存使用情况 free -m (总 已使用 剩余)
total:总计物理内存的大小
used:已使用多大
free:可用有多少
Shared:多个进程共享的内存总额
Buffers/cached:磁盘缓存的大小
Linux运行情况
linux buffer和cache
平衡二叉树的时间复杂度,怎么推导
hbase
大数据相关职业的了解
反问
 类似资料: