当前位置：首页 > 面试经验 >

美团基础研发大模型算法工程师实习面经

优质

小牛编辑

148浏览

2024-03-24

美团基础研发大模型算法工程师实习面经

一面

自我介绍
项目+论文
为啥项目中使用Ptuning？
说一下Ptuning的原理
如何关注训练过程中的指标？训练步数如何确定？
RLHF的整个流程详细
llama factory代码看过吗？
DPO了解吗？
算法题二分，medium，旋转数组的最小数字

二面

二面面试官问了很多开放性问题，就是丢给你一个一个问题/实际的步骤，问你怎么解决，怎么考虑，而不是问某某东西的原理

自我介绍
项目
训练大模型的数据如何弄的？
RLHF的三个流程中你觉得哪个应该是最重要的？为什么？
为啥RLHF中要用PPO？和其他RL算法的区别？
为什么需要Rewar model？
Reward model 如何训练？Reward model 你觉得训练到什么程度可以？
Reward model不准确怎么办？
如何提升RLHF的效率？你认为关键在哪里？
DPO的原理？
Rewar model和训练的LLM模型用同一个基座模型可能有什么作用？
Reward有多个目标可以怎么做？
算法题爬楼梯面试官会引导逐步改善最开始写的解优化算法到最优空间复杂度

#面经##美团##大模型#

类似资料：

热门公司

腾讯阿里巴巴华为字节跳动百度网易美团拼多多京东蚂蚁集团小米滴滴出行平安科技微博携程

相关阅读

多多买菜运营管培生三面，hr说是终面新凯来通信算法工程师面经（已收Offer）25届腾讯CSIG技术产品商务培训生面经华润电力项目开发管理员在线测评诗悦网络系统策划秋招面经

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

推荐题库

python常见排序算法基础教程 Ruby的基础语法入门学习教程 C#基础之泛型委托实例教程 seajs学习教程之基础篇 Bootstrap基础学习

推荐问答

算法练习用Java实现模X算法实现页面对象模型管纯在基础R（“基础管”）？Andoid开发人员基础培训