当前位置: 首页 > 面试经验 >

快star大模型应用面经

优质
小牛编辑
75浏览
2024-08-09

快star大模型应用面经

第一次分享,攒人品!
一面
岗位/面试时间
快star大模型应用/8月9日早上
面试题目
1.自我介绍
2.题目 leetcode300 最长递增子序列 15min 没让讲思路
3.研究进展,投什么会议
4.实习经历
5.实习项目中数据是怎么做的
追问,数据收集过程中是否有人工处理
蒸馏效果不好的原因是什么,用了什么额外的方式
有没有做量化和加速
6.偏好数据集是什么,偏好怎么定义的
偏好是怎么增强的
7.什么是打判,怎么打判的
使用的什么模型
8.如何解决模型幻觉(分方法,数据,prompt,微调,RAG等等)
9.长token输入效果衰减如何解决,效果如何(长度外推问题,建议直接看苏神的blog)
10.moe和dense模型的区别,各自的优缺点(随便答了一下moe效率高,每次激活一部分参数,但是同等参数量效果应该没有dense好)
反问:组里主要做对内的大模型应用,包括code辅助,个人RAG之类的
面试感受
面试官人很好,提问欲望强烈,实习经历问的很细,会对着简历上的东西一条一条问,本来还要问我的研究但是没时间了,最后问了三个简单的八股
背景
双C9,一段实习,无论文(或者说正在写)
希望能对大家有帮助!
#面经#
等一下结果
 类似资料: