torchvision.models

优质

小牛编辑

137浏览

2023-12-01

译者：BXuan694

models子包定义了以下模型架构：

AlexNet
VGG
ResNet
SqueezeNet
DenseNet
Inception v3

你可以通过调用以下构造函数构造随机权重的模型：

import torchvision.models as models
resnet18 = models.resnet18()
alexnet = models.alexnet()
vgg16 = models.vgg16()
squeezenet = models.squeezenet1_0()
densenet = models.densenet161()
inception = models.inception_v3()

我们在torch.utils.model_zoo中提供了预训练模型。预训练模型可以通过传递参数pretrained=True构造：

import torchvision.models as models
resnet18 = models.resnet18(pretrained=True)
alexnet = models.alexnet(pretrained=True)
squeezenet = models.squeezenet1_0(pretrained=True)
vgg16 = models.vgg16(pretrained=True)
densenet = models.densenet161(pretrained=True)
inception = models.inception_v3(pretrained=True)

定义预训练模型时会把权值下载到一个缓存文件夹中，这个缓存文件可以通过环境变量TORCH_MODEL_ZOO来指定。更多细节见torch.utils.model_zoo.load_url()。

有些模型在训练和测试阶段用到了不同的模块，例如批标准化（batch normalization）。使用model.train()或model.eval()可以切换到相应的模式。更多细节见train()或eval()。

所有的预训练模型都要求输入图片以相同的方式进行标准化，即：小批（mini-batch）三通道RGB格式（3 x H x W），其中H和W不得小于224。图片加载时像素值的范围应在[0, 1]内，然后通过指定mean = [0.485, 0.456, 0.406]和std = [0.229, 0.224, 0.225]进行标准化，例如：

normalize = transforms.Normalize(mean=[0.485, 0.456, 0.406],
                                 std=[0.229, 0.224, 0.225])

在imagenet的示例中可以看到标准化的一个应用。

下表是ImageNet单次224x224中心裁剪的错误率。

网络	Top-1错误率（%）	Top-5错误率（%）
AlexNet	43.45	20.91
VGG-11	30.98	11.37
VGG-13	30.07	10.75
VGG-16	28.41	9.62
VGG-19	27.62	9.12
带有批标准化的VGG-11	29.62	10.19
带有批标准化的VGG-13	28.45	9.63
带有批标准化的VGG-16	26.63	8.50
带有批标准化的VGG-19	25.76	8.15
ResNet-18	30.24	10.92
ResNet-34	26.70	8.58
ResNet-50	23.85	7.13
ResNet-101	22.63	6.44
ResNet-152	21.69	5.94
SqueezeNet 1.0	41.90	19.58
SqueezeNet 1.1	41.81	19.38
Densenet-121	25.35	7.83
Densenet-169	24.00	7.00
Densenet-201	22.80	6.43
Densenet-161	22.35	6.20
Inception v3	22.55	6.44

Alexnet

torchvision.models.alexnet(pretrained=False, **kwargs)

AlexNet模型，参见论文《One weird trick…》。

参数：	pretrained (bool) – 如果设置为True，返回ImageNet预训练模型

VGG

torchvision.models.vgg11(pretrained=False, **kwargs)

VGG11模型。（论文中的“A”模型）

参数：	pretrained (bool) – 如果设置为True，返回ImageNet预训练模型

torchvision.models.vgg11_bn(pretrained=False, **kwargs)

VGG11模型，带有批标准化。（论文中的“A”模型）

参数：	pretrained (bool) – 如果设置为True，返回ImageNet预训练模型

torchvision.models.vgg13(pretrained=False, **kwargs)

VGG13模型。（论文中的“B”模型）

参数：	pretrained (bool) – 如果设置为True，返回ImageNet预训练模型

torchvision.models.vgg13_bn(pretrained=False, **kwargs)

VGG13模型，带有批标准化。（论文中的“B”模型）

参数：	pretrained (bool) – 如果设置为True，返回ImageNet预训练模型

torchvision.models.vgg16(pretrained=False, **kwargs)

VGG16模型。（论文中的“D”模型）

参数：	pretrained (bool) – 如果设置为True，返回ImageNet预训练模型

torchvision.models.vgg16_bn(pretrained=False, **kwargs)

VGG16模型，带有批标准化。（论文中的“D”模型）

参数：	pretrained (bool) – 如果设置为True，返回ImageNet预训练模型

torchvision.models.vgg19(pretrained=False, **kwargs)

VGG19模型。（论文中的“E”模型）

参数：	pretrained (bool) – 如果设置为True，返回ImageNet预训练模型

torchvision.models.vgg19_bn(pretrained=False, **kwargs)

VGG19模型，带有批标准化。（论文中的“E”模型）

参数：	pretrained (bool) – 如果设置为True，返回ImageNet预训练模型

ResNet

torchvision.models.resnet18(pretrained=False, **kwargs)

构造ResNet-18模型。

参数：	pretrained (bool) – 如果设置为True，返回ImageNet预训练模型

torchvision.models.resnet34(pretrained=False, **kwargs)

构造ResNet-34模型。

参数：	pretrained (bool) – 如果设置为True，返回ImageNet预训练模型

torchvision.models.resnet50(pretrained=False, **kwargs)

构造ResNet-50模型。

参数：	pretrained (bool) – 如果设置为True，返回ImageNet预训练模型

torchvision.models.resnet101(pretrained=False, **kwargs)

构造ResNet-101模型。

参数：	pretrained (bool) – 如果设置为True，返回ImageNet预训练模型

torchvision.models.resnet152(pretrained=False, **kwargs)

构造ResNet-152模型。

参数：	pretrained (bool) – 如果设置为True，返回ImageNet预训练模型

SqueezeNet

torchvision.models.squeezenet1_0(pretrained=False, **kwargs)

SqueezeNet模型，参见论文《SqueezeNet: AlexNet-level accuracy with 50x fewer parameters and <0.5MB model size》。

参数：	pretrained (bool) – 如果设置为True，返回ImageNet预训练模型

torchvision.models.squeezenet1_1(pretrained=False, **kwargs)

SqueezeNet 1.1模型，参见SqueezeNet官方仓库。SqueezeNet 1.1比SqueezeNet 1.0节约2.4倍的计算量，参数也略少，然而精度未做牺牲。

参数：	pretrained (bool) – 如果设置为True，返回ImageNet预训练模型

DenseNet

torchvision.models.densenet121(pretrained=False, **kwargs)

Densenet-121模型，参见《Densely Connected Convolutional Networks》。

参数：	pretrained (bool) – 如果设置为True，返回ImageNet预训练模型

torchvision.models.densenet169(pretrained=False, **kwargs)

Densenet-169模型，参见《Densely Connected Convolutional Networks》。

参数：	pretrained (bool) – 如果设置为True，返回ImageNet预训练模型

torchvision.models.densenet161(pretrained=False, **kwargs)

Densenet-161模型，参见《Densely Connected Convolutional Networks》。

参数：	pretrained (bool) – 如果设置为True，返回ImageNet预训练模型

torchvision.models.densenet201(pretrained=False, **kwargs)

Densenet-201模型，参见《Densely Connected Convolutional Networks》。

参数：	pretrained (bool) – 如果设置为True，返回ImageNet预训练模型

Inception v3

torchvision.models.inception_v3(pretrained=False, **kwargs)

Inception v3模型，参见《Rethinking the Inception Architecture for Computer Vision》。

参数：	pretrained (bool) – 如果设置为True，返回ImageNet预训练模型