当前位置: 首页 > 面试经验 >

百度 自然语言处理 一面面经

优质
小牛编辑
93浏览
2024-09-10

百度 自然语言处理 一面面经

想向大家请教一个问题:

1. 为什么多轮对话和数值推理dpo的效果会比sft好?
2. 而哪些任务场景下sft比dpo效果好
有哪位佬可以点拨一下吗,我的回答被面试官说是从通用的角度(loss和sft的缺点)分析的,没用考虑数值推理这一特殊场景
#面经#
 类似资料: