当前位置: 首页 > 工具软件 > TorchCV > 使用案例 >

TorchCV:基于PyTorch的计算机视觉深度学习框架

西门飞翮
2023-12-01

最近,一个名为 TorchCV 的计算机视觉模型框架站上了 GitHub 趋势榜。该库提供了基于深度学习的大部分 CV 问题研究的源代码,对于使用者来说,调用最常用、最为先进的计算机模型从此可以变得更加容易。TorchCV 的作者 Donny You 来自北京大学,是机器感知与智能教育部重点实验室的一名研三学生。

TorchCV 支持图像分类、语义分割、目标检测、姿态检测、实例分割、生成对抗网络等任务中的多个常见模型。

链接:https://github.com/donnyyou/torchcv

实施文件

  • 影像分类

    • VGG:用于大规模图像识别的超深度卷积网络
    • ResNet:用于图像识别的深度残差学习
    • DenseNet:紧密连接的卷积网络
    • ShuffleNet:一种用于移动设备的极其高效的卷积神经网络
    • ShuffleNet V2:实用的CNN架构设计实用指南
    • 部分订单细分:在神经体系结构搜索中获得最佳速度/精度折衷
  • 语义分割

    • DeepLabV3:重新考虑原子卷积以进行语义图像分割
    • PSPNet:金字塔场景解析网络
    • DenseASPP:DenseASPP用于街道场景中的语义分割
    • 非对称非局部神经网络的语义分割
  • 物体检测

    • SSD:单发MultiBox检测器
    • 复苏的R-CNN:通过区域互联网络实现实时目标检测
    • YOLOv3:一个增量的改进
    • FPN:用于目标检测的特征金字塔网络
  • 姿势估计

    • CPM:卷积姿势机
    • OpenPose:使用零件相似性分段进行实时多人2D姿势估计
  • 实例细分

    • 面具R-CNN
  • 生成对抗网络

    • Pix2pix:使用条件对抗网进行图像到图像的转换
    • CycleGAN:使用周期一致的对抗网络进行不成对的图像到图像的转换。

火炬CV快速入门

现在仅支持python3.x,pytorch 1.0。

pip3 install -r requirements.txt
  CD扩展名
sh make.sh

TorchCV的表演

下面显示的所有性能完全重新执行了论文的结果。

影像分类

  • ImageNet(中心作物测试):224x224
模型培养测试前1名前5学士学位Iters剧本
ResNet50培养77.5493.5951230瓦ResNet50
ResNet101培养78.9494.5651230瓦ResNet101
随机播放网V2x0.5培养60.9082.54102440瓦随机播放网V2x0.5
ShuffleNetV2x1.0培养69.7188.91102440瓦ShuffleNetV2x1.0
DFNetV1培养70.9989.68102440瓦DFNetV1
DFNetV2培养74.2291.61102440瓦DFNetV2

语义分割

  • 城市景观(单比例整体图像测试):基本LR 0.01,作物尺寸769
模型骨干培养测试学士学位Iters剧本
PSP网3x3-Res101培养78.2084WPSP网
DeepLabV33x3-Res101培养79.1384WDeepLabV3
  • ADE20K(单尺度整幅图像测试):基本LR 0.02,作物尺寸520
模型骨干培养测试宣布ACC学士学位Iters剧本
PSP网3x3-Res50培养41.5280.091615瓦PSP网
DeepLabv33x3-Res50培养42.1680.361615瓦DeepLabV3
PSP网3x3-Res101培养43.6081.301615瓦PSP网
DeepLabv33x3-Res101培养44.1381.421615瓦DeepLabV3

物体检测

  • Pascal VOC2007 / 2012(单秤测试):20个班级
模型骨干培养测试地图学士学位时代剧本
固态硬盘300VGG1607 + 12_trainval07_测试0.78632235固态硬盘300
固态硬盘512VGG1607 + 12_trainval07_测试0.80832235固态硬盘512
复苏的R-CNNVGG1607_trainval07_测试0.7061个15复苏的R-CNN

姿势估计

  • OpenPose:使用零件相似性分段进行实时多人2D姿势估计

实例细分

  • 面具R-CNN

生成对抗网络

  • Pix2pix
  • 循环GAN

具有TorchCV的数据集

TorchCV已定义所有任务的数据集格式,您可以在数据集的子目录中检查该任务。以下是用于训练语义分段的示例数据集目录树。您可以使用文件夹数据集/ seg /预中的脚本对打开的数据集进行初步

DataSet
    train
        image
            00001.jpg/png
            00002.jpg/png
            ...
        label
            00001.png
            00002.png
            ...
    val
        image
            00001.jpg/png
            00002.jpg/png
            ...
        label
            00001.png
            00002.png
            ...

TorchCV的命令

以PSPNet为例。(“标签”可以是任何字符串,包括一个空字符串。)

  • 训练
cd脚本/ seg /城市景观/
bash run_fs_pspnet_cityscapes_seg.sh火车标签
  • 继续训练
cd脚本/ seg /城市景观/
bash run_fs_pspnet_cityscapes_seg.sh火车标签
  • 验证
cd脚本/ seg /城市景观/
bash run_fs_pspnet_cityscapes_seg.sh val标签
  • 测试:
cd脚本/ seg /城市景观/
bash run_fs_pspnet_cityscapes_seg.sh 测试标签

 

链接:https://github.com/donnyyou/torchcv

 类似资料: