文本生成图像工作简述1–概念介绍和技术梳理
文本生成图像工作简述2–常用数据集分析与汇总
文本生成图像工作简述3–技术难点、研究意义、应用领域和目前的局限性
文本生成图像工作简述4–扩散模型、自回归模型、生成对抗网络的对比调研
1、《Adversarial Text-to-Image Synthesis: A Review》2021年最新综述,文章较长,阅读笔记分了三部分,
Text to Image综述阅读(1.1)介绍与基本原理(基于GAN的文本生成图像)
2、《A Survey and Taxonomy of Adversarial Neural Networks for Text-to-Image Synthesis》,提出了一种分类方法:
3、《An Introduction to Image Synthesis with Generative Adversarial Nets》,2018年的一篇综述:
Text to image综述阅读(3)生成对抗网图像合成简介
4、《MISE:多模态图像合成和编辑Multimodal Image Synthesis and Editing: A Survey》
1、论文整理和阅读路线整理
⚡️⚡️⚡️2016~2021 文字生成图像 T2I论文整理 阅读路线和阅读指南⚡️⚡️⚡️
2、GAN-CLS和GAN-INT
GAN-CLS和GAN-INT:Generative Adversarial Text to Image Synthesis生成性对抗性文本图像合成(文本生成图像)
3、StackGAN
StackGAN:Text to Photo-realistic Image Synthesis with Stacked GAN具有堆叠生成对抗网络文本到图像合成
4、StackGAN++
StackGAN++:Realistic Image Synthesis with Stacked GAN(具有堆叠式生成对抗网络的逼真的图像合成)
5、AttnGAN
AttnGAN: Fine-Grained TexttoImage Generation with Attention(带有注意的生成对抗网络细化文本到图像生成)
6、MirrorGAN
MirrorGAN: Learning Text-to-image Generation by Redescription(通过重新描述学习从文本到图像的生成)
7、DMGAN
⛅️⛅️ DM-GAN: Dynamic Memory Generative Adversarial Networks for t2i 用于文本图像合成的动态记忆生成对抗网络⛅️⛅️⛅️
8、CookGAN
CookGAN: Causality based Text-to-Image Synthesis(基于因果关系的文本图像合成 )
9、CogView
CogView: Mastering Text-to-Image Generation via Transformers(通过Transformer控制文本生成图像)
10、DF-GAN
DF-GAN:A Simple and Effective Baseline for Text-to-Image Synthesis一种简单有效的文本生成图像基准模型
11、SSA-GAN
SSA-GAN:基于语义空间感知的文本图像生成 Text to Image Generation with Semantic-Spatial Aware GAN
12、GR-GAN
GR-GAN:逐步细化文本到图像生成 GRADUAL REFINEMENT TEXT-TO-IMAGE GENERATION
13、RAT-GAN
文本到图像合成中的递归仿射变换 Recurrent Affine Transformation for Text-to-image Synthesis
14、SD-GAN
SD-GAN:文本到图像生成的语义分解Semantics Disentangling for Text-to-Image Generation
15、Adma-GAN
Adma-GAN:用于文本到图像生成的属性驱动内存增强型GAN
16、PDF-GAN
PDF-GAN:文本生成图像新度量指标SSD Semantic Similarity Distance
17、VLMGAN
VLMGAN:基于生成对抗网络的文本生成图像视觉语言匹配Vision-Language Matching for T2I via GAN
18、DR-GAN
DR-GAN:分布正则化的生成对抗网络 Distribution-Regularization-for-Text-to-Image-Generation
1、AttnGAN本机复现
☕️ ☕️ AttnGAN代码复现(详细步骤+避坑指南)文本生成图像☕️ ☕️
2、AttnGAN云服务复现
利用谷歌colab跑github代码AttnGAN详细步骤 深度学习实验(colab+pytorch+jupyter+github+AttnGAN)
3、IS定量指标 实验复现
IS指标复现 文本生成图像IS分数定量实验全流程复现
4、FID定量指标 实验复现
FID指标复现踩坑避坑 文本生成图像FID定量实验全流程复现
5、R分数定量指标 实验复现
R分数指标复现踩坑避坑 文本生成图像R_Precision定量实验全流程复现
6、四步快速配置基准模型
四步快速配置一个简单高效的文本生成图像基准模型 T2I baseline
7、SSA-GAN九天云服务复现
利用九天深度学习平台复现SSA-GAN
8、DF-GAN远程服务器复现
DF-GAN实验复现——复现DFGAN详细步骤 及使用MobaXtem实现远程端口到本机端口的转发查看Tensorboard