1.自我介绍
2.项目拷打
3.实习拷打
4.微调的显存需求,如何估算?经典的Deepspeed举例
5.deepspeed 原理 (ZeRO三阶段、offload)
5.多标签文本分类,怎么选大模型,loss怎么设计(不太会传统的NLP任务,每个文本可能有多个标签,只回答了一个交叉熵损失)
6.z字螺旋矩阵生成(感觉不能叫螺旋矩阵):
具体为给定一个正整数N,生成下面形式的NxN的矩阵
N=4为例
7 13 14 16
6 8 12 15
2 5 9 11
1 3 4 10
不太会做,没做出来
------------------
一天三面累死了