阿里大文娱优酷,没做笔试直接约面试。
1.自我介绍
2.实习经历
训练数据有哪些组成部分?
每一个样本是只有一句话参与训练还是都参与?
用的什么训练框架?
SFT 的过程中有没有遇到什么困难?
你们这个流程中,有需要人力评估吗?在哪一部分?
多机多卡训练的时候用到了 deepspeed 吧?你了解 deepspeed 吗?
流水线并行了解吗?
你们训练的时候学习率怎么调的,用不用 warm up?
还有一些忘记了
智力题:10 个字的句子,最多能分成多少种分词?(实际上很简单,就是 10 个词中间 9 个空,分割过不分,2 的 9 次方。 我硬是用递归公式推了半天)
代码题: 给一个数 N,一个长度 L。 求一个非负整数连续序列,序列和等于 N,长度不小于 L。 多个答案的话要输出最小的长度。(有一些数学计算)
反问业务:做剧本辅助的大模型
面试官迟到五分钟进来说还在开会让我等一会。等了 30 分钟+面试 90 分钟,整体两个小时没绷住 hhh。