当前位置: 首页 > 面试经验 >

脉脉,大数据开发实习

优质
小牛编辑
83浏览
2023-05-08

脉脉,大数据开发实习

一面:(1h)
1.自我介绍
2.选一个熟悉的项目介绍一下吧
3.看你简历上写了进行过数仓的搭建,那你说一下数仓分几层合适?
4.每一层干了那些事儿?
5.你说一下数仓为何要进行分层?
6.数仓的建模方法知道吗?
7.指标分类有哪些?(回答的是原子指标,派生指标,衍生指标)
8.你的ods层为何选择gzip压缩呢?
9.除了gzip压缩还有哪些压缩方法?介绍他们的区别?10.项目中你的hive表使用了orc列式存储,你说一说有哪些好处。
11.还有其他的存储方法吗?有哪些区别?
12.看你第二个项目用到了clickhouse,你了解多少?(clickhouse没准备面试题,就简单的介绍了一下)
13.你简历上写了hive调优,说一下
14.小文件问题如何解决?
15.数据倾斜你是如何解决的?
16.内部表外部表的区别?
17.元数据的存储方式有哪些?
18.访问hive的方法有哪些?
19.那我们来写几个sql吧?用到了排序函数+开窗,topn,连续登录问题,行转列,列转行,一共8道题
20.Union和unionall的区别?
21.反问
二面
1.自我介绍(40分钟)
2.介绍一下项目3.项目问的比较深,问到了具体表中的字段
4.你数仓项目中的优化手段有哪些?
5.事实表的分类介绍一下
6.事实表的构建流程
7.会clickhouse吗
8.你说一下clickhouse和hive的区别
9.写sql题,6道题,写出5道,有一个写错了,比较简单,先说思路再写代码
10.个人情况的了解 #脉脉# #投递实习岗位前的准备# #我的实习日记#
 类似资料: