当前位置: 首页 > 面试经验 >

蚂蚁十面面经-大数据开发

优质
小牛编辑
162浏览
2023-03-28

蚂蚁十面面经-大数据开发

1-4面为春招实习,很遗憾最终没有通过,5-8面为秋招投递同一个部门,hr面后通知说换了一个组加一轮技术面和hr面,总体来讲实习面试更侧重实验室项目,秋招面试会细聊实习工作,每一轮的面试官都很nice,也都是一次很好的学习经历,感恩这一年和蚂蚁的相遇~

一面(技术面)

  • 介绍项目
  • 遇到了什么问题 怎么解决的
  • 介绍一下大数据的发展历程
  • 项目选型,为什么用这些组件
  • 介绍另一个项目
  • 除了准确率还用了什么指标来评判模型?
  • 医疗大数据有没有前景
  • 想从事什么行业

二面(技术面)

  • 介绍项目
  • 数仓的分层模型怎么做的,每一层做了什么事情?
  • Hive中大表和小表怎么聚合的?复制小表到maptask的过程是什么样的?
  • 维度模型里各个维度之间怎么聚合的?
  • 聚合过程的数据倾斜怎么解决?
  • 项目中遇到了什么问题,怎么解决的?
  • 随机森林和决策树的区别是什么?怎么体现随机的?
  • 场景题:
    • 1.一个城市里经纬度不同的一百万条数据 在hive中,怎么聚类?
    • 2.m个班,n个同学,两两之间聊天就会产生一个边,怎么评判一个班的活跃程度和是否有明星同学(一个点的边很多),产生明星同学的变化过程怎么衡量?
  • 概率:
    • 17个水果,10个苹果,4个橘子,3个香蕉,从里面拿9个,问恰好拿出4个苹果,3个橘子,两个香蕉的概率。

三面(技术面)

  • 介绍项目
  • 每一个部分具体的组件是做什么的?
  • sparkStreaming里的数据怎么处理的?
  • 维度建模怎么建的?分了哪几层
  • 建模的过程怎么进行数据质量管理?上万张维度表的话怎么很快的找见?
  • 每天数据量的规模(千万级)?
  • 十亿级的数据量这个系统要怎么优化,kafka里怎么优化?

四面(hr面)

  • 自我介绍
  • 职业规划
  • 从用户的角度谈谈健康码还可以有什么优化
  • 谈谈对支付宝这个产品的理解
  • gap考研的经历,有哪些收获
  • 从父母身上学到了什么东西
  • 大学有什么高光时刻
  • 谈谈技术回馈社会的理解
  • 做项目的时候怎么明确需求的
  • 做项目的过程里受到过最尖锐的批评
  • 学习的途径有哪些
  • 说一个你身边成功的人,你从他身上学到了什么
  • 来实习的话还有什么担心的

五面(技术面)

  • 实习工作
  • 10亿数据如何用Spark取top1000

六面(技术面)

  • 实习工作

七面(技术面)

  • 实习工作
  • 工作中有遇到过数据倾斜吗,怎么处理的
  • 介绍下Flink的exactly one

八面(hr面)

  • 和四面同一个hr,打电话说不用面了

九面(技术面)

  • 实习工作
  • 介绍一下温存技术
  • Flink和Spark的区别
  • 如何和pm或分析师的交流
  • 数据建设中最大的成就感是什么
  • 职业规划

十面(hr面)

  • 实习工作
  • 用三个词形容自己
  • 为什么要考研,考上之后和自己预想的有差别吗
  • 介绍下在学校的工作
  • 实习工作中最大的成就感
  • 从学校到公司有哪些转变
 类似资料: