1.在自然语言处理模型训练中,评价指标是怎样设定的?
2.自然语言处理中对低质量数据做数据清洗的方法?
3.LSTM和RNN有什么区别?解决什么问题?(梯度反向传播乘法变加法)
4.transformer中,attention矩阵的计算为什么要除以根号dk
5.多任务学习各loss差异过大怎样处理?(训练中给loss加入可学习参数)
6.多模态融合后,怎样知道最终结果受哪种模态影响更大?
7.甲乙两人分别投一枚硬币,正面获胜,甲先投,甲获胜的概率是多少?
8.过拟合应该怎样处理?
9.BN层在训练和推理过程中有什么不一样?
哥们主要做CV的,问的问题基本NLP和多模态,有点难顶。