一面
自我介绍,拷打论文和项目,围绕论文问八股。最后写了道题(不会写,简单说了下思路)。
二面
自我介绍,问了大模型的论文,围绕论文问了八股(你提到什么,就问你什么,从kv cache到flash attention,到sparse attention,到deepspeed。qwen和llama的区别等等,包括rope,ntk,还有在论文里扮演的角色,做了哪些贡献。如果做一个多模态大型应用到ocr中,打算怎么做,怎么改进)。
最后说我一面lc怎么没写出来,答:一直在搞论文,就没怎么刷题。
写题:岛屿数量。
后续:没信了