当前位置: 首页 > 面试经验 >

蚂蚁算法25面经(123技术+HR)已OC

优质
小牛编辑
204浏览
2024-04-12

蚂蚁算法25面经(123技术+HR)已OC

岗位算法工程师-视频理解,下面提供tl和具体内容

一面-3.28-40min

1. 自我介绍

2. 文章提问,描述问题背景、方法、公式推导,使用生成式模型的原因,师生模型的选择,损失函数的选择,文章负责部分

3. 项目提问,选择GMM的原因,项目中负责的部分,怎么评估项目效果

4. 代码题,二分查找,先讲思路,写完没跑,问复杂度、如何设计测试用例

5. 反问,偏向业务or研究?(业务)目前有落地吗?(理财部分视频内容的理解)研究有成果吗?(视频理解是近年才加的,之前倾向于图文数据的处理,有比赛获奖和论文)问我倾向业务还是研究,他们希望实习同学倾向研究

二面-4.3-30min

先问项目,再问论文

对论文比较满意,项目需要加强,比如GMM参数设置

问:大模型的发展是否会使得蒸馏CNN相关工作没有意义?首先,CNN模型相对于Transformer在参数量、计算量上还是存在优势的,同时其训练起来也更加容易收敛,因此在存在算力限制或数据限制的场景下还是CNN能够用更少的资源达到理想精度,因此CNN轻量化并不会随着transformer模型发展而失去意义。其次,现在大多数ViT模型仍然依赖3D-CNN网络对数据进行嵌入预处理,形成能被ViT使用的特征,因此CNN的轻量化仍然重要。

问:了解扩散模型吗?了解DiT在视频生成领域已有应用Sora

蚂蚁3轮技术面(有的2轮)+1轮HR面

这个方向偏向技术应用,包括视频内容的识别,为文本配视频语音生成等。蚂蚁中台偏向基础算法的研究。

三面-4.9-40min

讲论文,问这个工作有没有在实验室项目中应用,觉得学生baseline太低了(这里可以解释一下精度低是学生模型自身的原因,我们的工作只是提出一个新的3D-CNN模型的蒸馏方法,更好的学生模型必然导致更好的最终结果,我们在该学生模型上做只是方便验证我们方法的有效性)。讲现有工作。问本科做过相关工程没有。(感觉二面面试官提到过项目不太行,这次来拷打)问在啥数据集上做的,如果要自己动手收集该怎么做。答:模态是视频就行,方法有通用性只要是视频理解任务都可以。

提问,大模型训练出现幻觉,问训练大模型的语料在准备时有什么要注意的。答:一是文本结构,二是内容相关性。

要用模型清洗爬出来的文本数据,问具体怎么设计模型。答:大模型方法,利用提示工程;一般模型方法,半监督学习。

提问,怎么持续优化模型准确性,答:利用用户反馈持续学习。

还问后面的研究意向,我说CV和轻量化都比较合适。

感觉问的太大了,狠狠拷打。

HR面-4.11-15min

简历介绍,讲了一下论文和项目

问了一下对视频理解在工程落地上的了解,答海康威视在智能摄像头上做的挺好。

HR对在学校的内容比较满意,评价为扎实;但是认为对业界相关的落地情况不是很了解,举例抖音做得很好。说做CV还是要以业务为主,比如如何让视频内容丰富起来,或者用深度学习方法代替人工重复劳动。

闲聊,问后续发展意向,工作地点,来过杭州吗,能实习多久。

愿意给个机会尝试,会尽快推进流程,今年HC少,一个萝卜一个坑。

反问实习生去做什么,答有师兄带,向主管汇报,期望按照正式员工标准要求实习生。

以上为25年蚂蚁面经的基本情况,没有涉及的细节可评论区问我。每个人都有自己的节奏,祝大家最终都能取得心仪的OC!

#25实习##面经蚂蚁##蚂蚁算法#
 类似资料: