# 一面9.8
自我介绍
离线项目用到什么架构
实习使用的是什么开发语言
实习做的是哪一层的开发
阿里数仓分层是怎么做的
Mysql的索引是用的什么
为什么用B+树索引
一条语句select from where group by having在mysql中执行顺序是什么
mapreduce的执行过程
hive分区表和分桶表的区别
数据倾斜有哪些是怎么处理的
给题说思路
1. 统计主键出现次数
2. 最大连续登录天数
3. 直播间最大人数
反问
# 二面 9.11
自我介绍
流批一体的建设方案
阿里指标建设规范
在阿里做过数据应用吗
离线项目技术架构
离线项目团队分工
为什么实时数仓用clickhouse
场景题:面对维度变化较快,需要大量join的任务,而没有那么大的宽表任务,可以使用什么数据库
讲一讲hbase原理,写数据怎么写的
hbase为什么写比读快
hive、hbase、clickhouse、mysql各自的应用场景
反问:招银数据建设情况、数据开发职业发展
# HR面 9.14
现场面约到了早上八点半,太早了,七点起床赶过去结果晚到了二十分钟。。不知道会不会有影响
自我介绍
兴趣爱好
怎么产生读研想法
为什么想做数据开发
为什么想做金融科技
想在哪里工作
目前已有的求职进程情况
朋友对我的评价
实习学到的东西
自己的缺点
项目最大的困难
反问
总体和互联网大厂比算简单,希望有个好的结果吧!