当前位置：首页 > 面试经验 >

发面经攒人品

优质

小牛编辑

103浏览

2024-05-16

发面经攒人品

视觉算法实习生-组内做图像生成，拷问了很全面的图像生成知识，记录一下，也方便后续回顾。
1.Stable Diffusion的1.x/2.x/XL/3.x 各个版本的区别
2.SDXL的双文本信息处理/采样方式的改进/Refiner结构/训练集的多尺度
3.Stable Diffusion的结构和各个模块的功能
4.VAE的输入输出维度、编解码器施加的约束（量化/patch对抗）
5.CLIP的pipeline/loss
6.Unet的输入：时间步/随机噪声/条件-交叉注意力，输出：噪声期望
7.采样器：DDPM-重参数化/DDIM/EDM
8.微调：Lora/Adapter/Dreambooth/Text inversion
lora和prompt engineering能否达到相同效果
lora的label咋来？BLIP
为什么用BLIP？ BLIPv1v2 区别
10.CFG的训练和推理
11.Transformer结构：解码器的交叉注意力QKV是谁？
12:Vision Transformer结构
13.GAN和Diffusion优缺点

类似资料：

发面经攒人品

热门公司

相关阅读

推荐文章

推荐题库

推荐问答