1.⾃我介绍
2.介绍⾃⼰的项⽬
3.项⽬中数据语料
4.你怎么评价你⾃⼰构建的数据集的好坏?
5.chatGLM 和 GPT 模型结构⼀样吗
6.⼤模型训练⽅式
7.怎么评价⼈类⾼质量回答的数据集?精⼼处理的数据集作⽤?
(精⼼处理的数据集只能保证回复还⾏,但不可能只能只对⼀个场景)
8.强化学习中怎么⽤奖励模型打分?怎么样的分数?奖励模型是怎么得到的?
9.⽤强化学习的梯度更新是怎么实现的?
10.什么样的 prompt 是好的 prompt?
11.Instruct 和 prompt 有什么区别?
12.现在⼤模型有哪些的缺点
13.模型幻觉怎么解决?
14.⼤模型对话和传统的 nlp ⼈机对话⽅案有什么区别
15.(⼈机对话)你怎么知道⽤⼾输⼊之后,触发⼀些问题
16.传统⼈机对话中⼀个问题给 K 个回复吗
17.(⼈机对话)相似度怎么计算;这种度量的模型怎么训练?
18.命名实体识别遇到嵌套识别该怎么做?
19.⽂本分类中⼀个⽂本有多个类别的话,该怎么做?
20.⽂本分类中类别不均衡问题怎么解决?
21.⼤模型的幻觉怎么评测?
22.什么是⻓⽂本?⼤模型⻓本⽂怎么做?
23.你项⽬中⻓⽂本⽤的多⻓?
24.tokenizer的步骤
#算法# #春招# #牛客解忧铺# #牛客在线求职答疑中心# #科大讯飞求职进展汇总#