公司:蚂蚁集团
部门:信贷事业群-风险管理部
岗位:数据研发工程师
形式:电话面试
时长:31分钟
流程:
1、自我介绍。
2、对数据开发岗有了解吗?
3、实习的时候接触到的数据来自哪里?
4、你是怎么理解数据仓库这个岗位的?
5、你刚才提到了数据沉淀,那你觉得有哪些方法来做数据沉淀?
6、如果让你做数据ETL的话你有兴趣吗?
7、对大数据的技术栈哪些比较熟悉?
8、传统的数据仓库和关系型数据库有什么区别?
9、为什么数仓要分层?
10、介绍一下维度建模。
11、Hive的内部表和外部表有什么区别?
12、Hive中的join有哪些?
13、用过哪些窗口函数?row_number和rank的区别是什么?
14、Hive数据倾斜有哪些处理方法?在实习期间有遇到过这种问题吗?
15、Hive的join是怎么转化为MR的?
16、介绍一下最近的实习工作,在实习中遇到了哪些困难?
17、当业务口径和数据口径不一致时,怎么说服运营?
18、项目细节深挖。
19、与业务方合作时,业务方用数的时候发现数据有问题,后续应该怎么处理?
20、反问
#软件开发2023笔面经##软件开发春招备战日记##蚂蚁面试##蚂蚁集团##我的实习求职记录#