当前位置: 首页 > 面试经验 >

智谱 GLM预训练 二面

优质
小牛编辑
61浏览
2024-09-20

智谱 GLM预训练 二面

询问项目:
预训练数据清洗流程
爬虫数据来源
数据挖掘流程
继续预训练策略选择
评测集是怎么合成的
数据配比对模型能力的提升
大模型与小模型之间的scaling law
图文模型怎么收集数据,怎么制作评测集,怎么数据增强
八股问了
1F1B的流程,解决了dreampipe什么问题
microbatch的意义
空泡时间怎么算
zero123的区别
如果是3D并行zero最多开多少,如果开到2会怎么样
他们好像很想要提前实习,从一面到二面一直在提。
一天后约HR面。
#牛客创作赏金赛#
 类似资料: