好未来-base北京-nlp
lora的矩阵怎么初始化?为什么要初始化为全0?
gpt源码past_key_value是干啥的
gpt onebyone 每一层怎么输入输出
输出的分布如果比较稀疏,有个尖尖应该怎么处理
讲讲决策树,决策树回归问题怎么做
gpt的输出topp是啥
kl散度的公式和kl散度与交叉熵的区别
强化学习的输入
chatgpt的reward model怎么来的,三阶段
cart树的分裂准则是啥
做题:寻找重复数
除了cosin还有哪些算相似度的方法
文本embedding方法
tfidf公式
场景题1:师生多轮对话文本(音频转化),如何把无关信息剔除,比如说老师早上好这种
场景题2:偏推荐一点,给学生推荐试题,不希望出现做过的相似题目
#面经##算法#