一面 10.10日 1.5h(一面挺难,像cto)
自我介绍,讲一下大模型应用项目(我讲的nl2sql的项目)
项目背景,总体思路,解决什么问题,指标是什么
细节拆分:
1.数据集怎么构建的,什么规模,有没有质量评估
2.模型底座是什么,这些不同底座什么区别,什么规模
3.训练方法,用的什么sft,有什么不同,有什么优缺点,原理上解释不不同方法的差别
4.评估指标是什么,这些指标存在哪些问题
5.模型推理是怎么做的,有没有cot,tot等等,还是单轮
6.模型可控性如何实现,怎么保证可控性
7.模型部署的平台,推理效率怎么样,如何提升推理效率
8.有没有上线,面临什么问题,怎么解决
9.给一个总的输入输出样例,每一步包含什么prompt,多轮推理每一步输出什么结果,模拟一下,数据集格式是否要调整成这样,数据形式是什么,怎么拆分成多轮形式等等。。
到这里项目差不多了大概问了45min
然后是八股+开放式问题
1.大模型前景
2.大模型主要存在的问题和解决思路(幻觉,定向编辑,继续训练等等)
3.大模型加速框架了解多少,知不知道原理 如何进行加速优化
4.为什么要用大模型做传统结构化解析任务 你对用大模型做这些事有什么看法
到这差不多1小时
最后是能不能实习,对最新的研究了解多少,看过多少最新论文等等
我本以为结束了,但是,最后我们来做一道题吧
题我忘了,好像是一个迭代法求根的题,反正当时已经神志不清了,好像没ac
2.二面10.13日 45min
很简单,感觉是部门leader,简单问了问项目,普通八股,大模型上线会有什么问题,占用多少资源,怎么优化等等,比一面简单太多