更新一下,链接消失了,过了,进入复试环节了等三面
------------
TEG 做游戏AI的
1. 自我介绍
2. 手撕二叉树路径
3. 问比赛,是个多智能体强化学习相关的,问主要负责哪些部分,有效果的改进是什么
4. 问项目,也是多智能体强化学习相关的研究项目,面试官这里问的有点偏,主要是纠结RLHF的偏好标签的问题
5. 问多智能体强化学习的算法,说了一下两大类的经典QMIX和MADDPG
6. 问实习,讲了一遍实习经历,问RLHF(PPO)、DPO、RPO的区别,DPO的缺陷在哪里
7. 问PPO的GAE计算
8. 问MARL的解决效用分配的算法中,效用分配体现在哪里
反问,主要做游戏AI,强化学习用的多,LLM也在探索
整体就是这么多,45分钟不到,基本上比赛、项目、实习都问了,可能我没有论文提不起兴趣吧
先许愿一个过吧,坚持两个小时不被挂就是胜利!
#腾讯求职进展汇总##软件开发笔面经#