1、自我介绍
常见问题,问了研究方向,能实习多久
2、问答环节,主要是简历、开放性问题以及比较简单的八股。
问我第一个复现baseline的项目(课程大作业),为什么会有注意力机制?还有注意力是什么?
熟悉最新的大模型吗?不熟悉,只了解比较老的bert等transformer架构,然后问transformer的结构,说最新的都是decoder only,为什么会这样?
模型太大,如何解决?不懂,只回答得上来多头注意力机制?让我解释多头注意力机制。
看我有准备c++,问了一些我只听过的,比如叫我实现线程池、生产者消费者模型。不会,扔给我一道牛客题库随机的题(类似最大为1的矩阵),过于紧张,思路错了,改成类似前缀和的思路还是有bug,然后让讲思路。
因为我说我c++只能到stl,问了vector和list的区别?
熟悉智能指针吗?他们之间的区别?开始吟唱。
3、反问
问实习的工作?主要是做大模型训练优化。
问有人带吗?有导师带。
有几面? 至少有二面。
整体挺好的,加上自己投这个岗位也是因为jd描述得很简单,面试官是个小姐姐,而且很温柔。问的问题也很常规,主要是还是自己学的不够深入没有自己的思考,基础也不扎实,而且手撕写不出来不应该太丢脸了。在这之后应该不会再投了,好好沉淀。
最后,面试第一个问题问我怎么只过了四级,给我破防到最后