暑期摆大烂选手,5.14在牛客上看到蚂蚁实时数据开发岗位的内推,很是心动并且决定投出第一份暑期正经简历。第二天就收到了面试官电话...让我补做一下测评和笔试。但是官网没有新的数据研发的笔试安排了,面试官让我一面的时候把笔试顺便做了。
部门:CTO-数据产品与技术部
2023.5.17 一面
笔试:算法*2+SQL*3。面试官让20分钟内写完,我大概写了25分钟。
面试:
- 自我介绍
- 介绍实习里参与度比较高的一个项目。挖了一挖项目细节,比如数据的质量、时效是如何保障的,如何和后端联动让数仓的数据在线上被使用。
- 流量数仓重构建设的部分,当前实习部门的流量数仓存在哪些问题,做了哪些工作去解决问题。
- 实习公司的查询引擎用的是哪种?Hive和Spark有什么区别?
- join任务如何转化成MapReduce任务的,描述一下过程的细节。
- 实习中是否接触过实时数据开发(答没有,但大概说了一下部门其它同事做的实时相关的内容)。在你的了解中实时数据开发有哪些业务应用场景
- 觉得自己有什么优势和缺点
- 反问:(1) 部门主要工作(2)后序还有几轮面试(3)对我有什么建议
2023.5.20 二面
- 自我介绍。目前在哪个城市。
- 对数据分析和数仓开发的理解
- 面试官对我实习里做的一个项目很感兴趣,所以我就主动介绍了一下项目的前因后果。
- 实习里的数仓建设开发工作,关于流量、用户路径跟踪、前端埋点等等
- Greeplum、Doris、Hive、Spark说说你的理解。为什么当时从Greenplum迁移到Doris,迁移之后就不会存在性能问题、存储问题等等了吗?
- 关于数仓迭代重构的问题,如何避免反复重构
- 实习公司是如何做指标管理的,具体分成哪些类型的指标,有没有用过成熟的指标管理的工具
- 面试官问我觉得自己可以从哪些方面提升
- 在实习中哪些地方更深入地理解了数仓建模理论,举个例子
- 实习中是否接触过实时开发(没有接触,但是有主动去了解了同部门其他同学做的实时开发工作,介绍了一下)
- 对加班的看法
- 预计到岗时间
- 反问:后续面试流程+离线转实时开发需要补齐哪些知识+对我的建议,学一下Flink
2023.5.21 三面
- 自我介绍
- 实习公司的数仓分层,每一层为什么要这么设计,有什么用途
- 遇到数据计算慢的问题是怎么处理的
- 大表join大表如果数据倾斜了怎么优化
- 为什么不在现在实习的公司选择转正,为什么想去杭州
- 口述一道窗口函数的sql
- 口述两道python的代码,和字符串处理有关
- 算pv uv时count(distinct user_id)怎么优化
- kmeans原理,计算过程,开始迭代的状态和最终迭代停止的判断条件
- gdbt的原理和计算过程(我不写什么算法面试官就问什么算法hhh)
- 在选公司和部门时最看重哪些要素
2023.5.22 HR面
应该是HRG,气场太强了。也让我深刻地意识到了说得越多给自己挖的坑越大...
- 自我介绍
- 是保研吗
- 是中国国籍吗(本大冤种后来看官网才发现我姓名一直写的是拼音,收到的面试邮件也是拼音...之前甚至没有意识到不对的地方)
- 分享实习里的一个项目。为什么想要分享这个项目?遇到了什么困难,如何解决。
- 作为一个实习生,在工作对接中是否遇到过身份带来的困难,如何解决。
- 你认为数据研发这个岗位工作中最重要的是什么。
- 如何融入一个团队。
- 三个关键词形容自己是一个什么样的人,举例证明。
- 遇到过最大的挫折,如何解决。
- 在团队合作中遇到过什么样的困难,如何解决。
- 为什么没有在上家公司选择转正。
- 为什么投递实习这么晚...为什么没做笔试...
- 最大的缺点。
- 来杭州实习方便吗,入职时间,可以实习多久。
- 告知实习待遇。口头承诺意向书(可以理解成OC嘛这个)
2023.5.24 意向
感谢每轮面试官都给出了很正向的反馈,让我获得了被肯定的信心和快乐。那就期待接下来在杭州的日子吧~
#蚂蚁2024暑期实习##数据研发#
#面经#