当前位置: 首页 > 面试经验 >

9.09腾讯混元应用组一面

优质
小牛编辑
79浏览
2024-09-09

9.09腾讯混元应用组一面

1. 介绍一下风格迁移论文做法
2. 如何对风格和内容做解纠缠(instantstyle)
3. 但是现在都是clip倒数第二层,clip只在倒数第一层做了文图对齐,你会怎么进行解纠缠/对齐(取很多相似的图像做few-shot的IPA平均,这样子当个数够多时候他们的平均就只代表风格,淡化内容;做风格 风格话图像 内容图像三元组显示训练) 现在想想对齐也可以拿QK得到attention map Q是text K是图像
现在基于dit的架构很少有这样子的探索,如果是你的话你会怎么做?(现在想想应该采用B-LORA的思路去探索)
4. 想要语义风格迁移,比如对应帽子 对应裙子该怎么做?(无他 attention就是语义相似性)
5. 风格是怎么定义的?(gram矩阵 均值方差)
6. 换另外一个面试官问虚拟试衣的做法,我负责的改进,有没有show case
7. 针对复杂背景虚拟试衣怎么做? 你这个项目是最重要上线吗? 现在的inpainting虚拟试衣文本控制能力会很弱,有没有更好的想法让可以做到文本编辑还可以试衣(大意了,应该讲一下cvpr2024谷歌的instructimagen这种工作)
8. 文生图可控生成的能力会不会下降,(会有一点,可图做的还是不错的)
9. 介绍一下美团做的项目,k-means怎么选质心?为什么不用dbscan或者hdbscan? (我把这个忘了 得想想后面肯定还问)k-means聚类也不见得效果就好
10. 生成式检索和判别式的区别
11. 怎么之前都在做多模态和agic跑去做nlp了?
12. coding: 1262 可被三整除的最大和(我写的只过了样例,唉 这题看答案就很难)
13. 能不能提前实习,介绍了一下业务,做ipa插件应用(感觉得补补ipa最近的工作)
 类似资料: