小白人生的第一次技术面,问的挺细,我nlp也关注的是大模型的一些trick,基础没系统学那么深于是凉凉
nlp部分:
1.transformer的decoder输入“你好”两字,是如何输入“hello”五个字母的,其中的loss如何计算,细化到token级别
2.transformer的自回归体现在哪个部分
3.中文分词的一些算法
linux部分:
1.如何查看文件行数
2.有一个很大的文件,想看前几行,用什么指令
面试官很努力在提示了,但我啥都没答上来把他整无语了,后面又问了一些项目经历,15分钟就结束了恶补基础三月再战