1.项目深挖(多语言电商文本层级分类)
问项目中数据集的分布,数据规模,数据什么特点,是否存在标签不一致?
2.样本不均衡如何处理,文本平均长度,项目使用的方法?
3.分布式训练怎么做,你的贡献在哪里?
4.预训练任务如何设计,基于roberta的改进点在哪里?
5.上线前是否做了消融实验?
6.评测方结果可以得出哪些结论?
7.哪些指标还可以继续优化?
8 有没有考虑上线的模型做蒸馏?
9.什么是macro-F1.recall,precision?写出公式并解释算法题20mins:
10.一道leetcodemedium实现前缀树
#百度信息集散地#
#秋招##提前批##面经##提前批过来人的忠告#