问题：

人工智能 - 目前的开源视觉大模型有哪些？

江礼骞

2024-01-29

目前的开源视觉大模型有哪些？

我知道的只有智谱的 CogVLM，还有其他的吗？

https://github.com/THUDM/CogVLM

共有1个答案

陶鹏

2024-01-29

目前开源的视觉大模型有很多，其中一些比较知名的包括：

CogVLM：这是智谱AI开发的一个基于Transformer的预训练语言模型，可以用于视觉任务。CogVLM在大量的无标签图像数据上进行了预训练，并使用图像文本对进行了微调，以实现图像分类、物体检测和语义分割等任务。
ViT：这是由Google开发的基于Transformer的视觉大模型，全称是Vision Transformer。ViT将Transformer应用于图像分类任务，将图像分成固定大小的patches，然后将这些patches作为输入传递给Transformer。ViT在ImageNet等大型视觉数据集上取得了很好的性能。
Swin Transformer：这是由微软亚洲研究院开发的一个层次化的Transformer结构，可以用于各种视觉任务。Swin Transformer在ImageNet等数据集上取得了很好的性能，并且由于其层次化的结构，可以很好地处理大规模的图像。
MobileViT：这是由华为诺亚实验室开发的一个轻量级的视觉大模型，旨在提供高性能的同时保持较低的计算成本。MobileViT使用类似于ViT的结构，但进行了许多优化，使其可以在移动设备上运行。
PVT：这是由阿里巴巴开发的一个多尺度视觉大模型，全称是Pyramid Vision Transformer。PVT使用类似于Swin Transformer的多尺度特征提取器，可以有效地处理不同尺度的图像特征。

以上是一些比较知名的开源视觉大模型，当然还有很多其他的模型。这些模型都使用深度学习技术，并在大量的图像数据上进行训练，以实现各种视觉任务，如图像分类、物体检测、语义分割等。

类似资料：

人工智能 - 有什么好用的文字转语音的开源模型？

有什么好用的文字转语音的开源模型？要求如下：开源免费可以离线部署，不需要联网人声多样，不单一可以做到声情并茂，语气自然
人工智能 - 有没有这样的 ai 的开源库?

提供两个人像的正面照,然后输出面部的差异。例如如果越像的话输出的差异值就越少
人工智能的类型

主要内容：AI类型 - 1：基于功能,人工智能类型-2：基于功能人工智能可以分为多种类型，主要有两种类型的主要分类，它们基于能力并基于AI的功能。以下是解释AI类型的流程图。 AI类型 - 1：基于功能基于能力的人工智能的类型如下 - 1. 弱AI或狭隘AI 狭隘AI是一种能够执行智能专用任务的AI。最常见和当前可用的AI是人工智能领域的狭隘AI。狭隘的AI不能超出其领域或限制，因为它只针对一项特定任务进行培训。因此它也被称为弱AI。如果超出限制，缩小的A
人工智能与大数据

主要内容：1.关系,2.区别1.关系现在，没有什么流行词比大数据和人工智能更常见了。无数的分析家向我们保证，将从根本上重塑我们的日常生活。事实上，对于围绕人工智能和大数据的所有讨论，很少有人提到这两种新兴技术的融合，尤其是在解释人工智能为什么迫切需要大数据以取得成功的时候。这是人工智能和大数据操作之间的秘密联系，以及这两种新兴趋势将如何主导21世纪。没有大数据就不能拥有智能机器在开始描述人工智能和大数据如何一起工作之
人工智能

Kubernetes 在人工智能领域的应用。 TBD kubeflow - Kubernetes 机器学习工具箱
人工智能代理类型

主要内容：1. 简单的反射代理,2. 基于模型的反射代理,3. 基于目标的代理,4. 基于效用的代理,5. 学习代理代理可以根据其感知智能和能力的程度分为五类。所有这些代理都可以改善其性能并在一段时间内产生更好的行动。这些如下：简单的反射代理基于模型的反射代理基于目标的代理商基于效用的代理学习代理 1. 简单的反射代理简单反射代理是最简单的代理。这些代理人根据当前的感知来做出决定，并忽略其余的感知历史。这些代理只能在完全可观察的环境中取得成功。简单反射代理在决策和行动过程中不考虑

人工智能 - 目前的开源视觉大模型有哪些？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档