一、智谱AI GLM对齐组 二面
1. 自我介绍
2. 昨天晚上面的,很多记不得了
3. 主要问了一下实习做便好对齐的一些DPO的细节
4. 问了一下RLHF强化学习部分的一些优化
5. 问了我做DPO训练的资源和时间消耗(这里有点忘了,结果面试官估算了一下算的非常准确)
6. 问了我项目里面做PPO训练的时候的资源消耗(记不得,现场推算了一下)
面试官水平很高,对齐方面问的很深入,感觉我半路出家还是不太行,面试官对我也不是很感兴趣,半个小时就结束了
今天问HR挂了没,还没有明确结果
二、中兴 算法工程师(智算) 三面
1. 自我介绍
2. 主要拷打实习,问了很多继续预训练的细节,比较在意有没有对基座模型进行修改
3. 我三面专家面的画风好像跟我在牛客上看到的不太一样,偏向于聊天面,没有太多参考意义
目前状态已经进 综合评估 状态了
三、智源研究院 行业大模型 二面
1. 自我介绍
2. 主要拷打实习的继续预训练、SFT、DPO的所有内容
3. 问了一些LLM的传统八股,有一个比较答的差的问题,SFT的loss具体是怎么算的?感觉这个下去还得仔细看看代码,平常基本上就是用框架,没太关注过
上面三个面试都没有手撕
#智谱AI##中兴求职进展汇总##智源##软件开发笔面经#