百度上海的岗,做广告推荐的部门
timeline:
8.22 投递 9.1 测评 9.4 一面 9.10 二面 9.12 显示共享中
一面1个小时,基础八股+项目+手撕
1. 自我介绍
2. 介绍clip模型
3. 项目:大模型SFT数据细节,prompt设计方式,介绍cot
4. MLLM了解情况,介绍一些现有模型
5. 介绍lora
6. 一作论文详细介绍
7. 介绍CNN模型,池化的作用
8. 词嵌入的发展历史,word2vec训练方式
9. 介绍transformer、self-attention
10. bert和gpt的区别,为什么前者用于理解,后者用于生成
11. 介绍GAN模型,生成器/判别器的损失函数,介绍模式崩塌现象和解决方法
12. 介绍第二篇论文
13. 分类模型的发展历史
手撕:快速排序
二面1个小时,机器学习八股 + 项目深挖 + 业务理解 + 手撕
1. 自我介绍
2. 项目:介绍项目的应用场景,整体流程,数据量
3. 使用什么模型(MLLM),和LLM有什么区别
4. 介绍transformer
5. 给定一个业务任务,如何完成模型搭建(ps.面试官大概意思是从数据处理-模型选择-效果验证角度详细说明
6. 介绍过拟合、欠拟合现象及解决方法
7. 介绍深度学习的优化策略(ps.可能包括学习率优化、梯度更新策略、超参数选择等方面,没答全面
8. 激活函数介绍,sigmoid 和 relu的应用场景及区别
9. 是否了解广告、推荐相关(介绍了一个实习中一个搜索相关的小项目,CTR啥的不太懂
10. 计组知识:进程与线程区别、死锁及解决方法
手撕:给定一个数组,判断它是否是一个二叉搜索树的后序遍历
(ps. 有些问题记不太清楚了,仅供参考