面试官:今天我们面的是 实习岗位
我:啊?
面试官:不好意思看错了,最近面试太多了
1.自我介绍
2.项目介绍(一个小时。。直接联影 面试 PPT 拿过来聊)因为业务几乎一样,一直聊各种细节
大部分都是项目,比较有代表性的有一些
你们如何评估模型的最后的质量?
你们怎么评估训练数据的逻辑?
怎么解决 rag 检索到的内容模型用不上?
还有很多都是项目相关
一个小时左右了,就随便问了几个八股
训练用的 deepspeed 吧?你了解吗?介绍一下?(不记得了。。。最近完全没看这种八股。我说 deepspeed 本质就是模型部署多个在多个卡,一起训练,应该是模型并行还是数据并行来着。。。)
面试官:deepspeed 本质就是数据并行,那你知道这一些并行方式吗?3D 并行之类的(道歉,最近确实没咋看这块,就讲了一下张量并行,数据 模型并行)
面试官:虽然现在都很集成化,但是下去还是要多看看这块,不单单是我这边问,别的面试也可能会问到。
Llama 用 group query atten 了解吗?(大概讲了一下,也没细追问,还好)
面试官:虽然已经一个多小时了,但是出于流程原因还是要这个代码,一个最长公共子串(秒了)
面试官:好,你有啥反问的吗(反问)嗯,我会把今天的情况如实反馈,如果有后续我们会再约面。
求三面