个人情况简述:本硕双非,acm银牌
随便找群友要了个内推投递
笔试4.2题,投递选择的是都喜欢,笔试完在人才池待了十几天,被数仓部门捞了
一面(总时长50分钟)
聊实习经历和简历项目,聊了约30分钟
聊天环节把整个技术栈聊的差不多了,还有离线、实时数仓的很多点,后面又问了几个问题
离线数仓分层设计、实时数仓设计,spark、flink相关生成经验,S3、OSS的使用理解,k8s的使用心得等都在聊项目的时候就说了,后面提问环节大概就不到10分钟,所以没问什么问题,都比较简单
1.项目中怎么保证redis和mysql的数据一致性的
2.对离线数仓的理解,发散了讲
3.对维度建模的理解
4.星型模型的优缺点
5.讲讲拉链表和其应用场景
6.spark sql和hive sql的区别
7.flume、kafka的一些数据重复消费问题
一道sql题:求用户连续登录的次数
结合row_number()和lag()实现,直接秒了
总结
个人喜欢数据方向所以选择走的大数据,对数据领域还是有一定的个人理解的,数据岗基本不能照抄项目必须有自己的业务理解,不然很多开放性的问题上会自以为答的对,但距离实际有很大的距离。
吐个槽,数开领域笔试面试普遍要写大量的SQL,很多时候不出ACM类型的算法题,如果有算竞同学想走数据方向要注意这个问题,可能自己的先发优势会被较大削弱
#我的实习求职记录#