当前位置: 首页 > 面试经验 >

腾讯大模型 一面凉经

优质
小牛编辑
79浏览
2024-05-30

腾讯大模型 一面凉经

bg26届双9文跨,无论文无实习,项目是玩具

1.自我介绍

2.问项目

3.讲Zero原理,讲的比较细致

4.问transformers的具体实现,问根号k为什么要除,我说为了训练稳定性,问具体原因,是如何影响训练稳定性的,不知道。

5.问transformer参数量占比,FFN层占比例多少,不知道。

6.算法题是最长递增子序列,1分钟A了

 类似资料: