
自我介绍
LoRA是怎么用的
Llama3中的注意力机制是怎样的
项目中的奖励模型是如何训练的
奖励函数如何设计
DeepSeek中的奖励模型是如何训练的
什么时候开始接触大模型的
深挖项目
指出项目实验的一个点,测试两个模型胜率时应对每一个prompt进行多轮测试,GPT4有位置偏好
介绍预训练的微调的区别
预训练的基座大模型可以对话吗
代码:岛屿数量(白板模式)
反问:部门实习生干嘛,和正式员工差不多。研究方向:有道词典中英文互译,中小学生答题的大模型落地。薪资:不知道
面试官人挺好,问题都是围绕项目来问的,就像同僚之间交流一样,他说他的观点,指出我项目的不足,我也说我最近看的论文,互相分享技术。
3.11还没消息,估计挂了