EasyCV 是基于 PyTorch 的一体化计算机视觉工具箱,主要专注于自监督学习、基于 Transformer 的模型,以及主要的 CV 任务,包括图像分类、度量学习、目标检测、姿态估计等。
SOTA SSL 算法
EasyCV 在基于对比学习的自我监督学习中提供最先进的算法,例如 SimCLR、MoCO V2、Swav、DINO 以及基于蒙版图像建模的 MAE。我们还提供用于 ssl 模型评估的标准基准测试工具。
视觉变形金刚
EasyCV 旨在提供一种简单的方法来使用通过监督学习或自我监督学习训练的现成 SOTA 变压器模型,例如 ViT、Swin Transformer 和 DETR 系列。未来将添加更多模型。此外,我们支持来自timm的所有预训练模型。
功能和可扩展性
除了 SSL,EasyCV 还支持图像分类、物体检测、度量学习,未来将支持更多领域。虽然涵盖了不同的领域,但 EasyCV 将框架分解为不同的组件,例如数据集、模型和运行钩子,从而可以轻松添加新组件并将其与现有模块组合。
EasyCV 提供简单而全面的推理接口。此外, PAI-EAS支持所有模型,可以轻松部署为在线服务,并支持自动扩展和服务监控。
效率
EasyCV 支持多 GPU 和多工人训练。EasyCV 使用DALI加速数据 io 和预处理过程,并使用TorchAccelerator和 fp16 加速训练过程。对于推理优化,EasyCV 使用 jit 脚本导出模型,可以通过PAI-Blade进行优化
[��最新消息] 我们发布了我们的 YOLOX-PAI,它可以在 40~50 mAP(小于 1ms)内实现 SOTA 结果。我们还提供了一个方便快捷的导出/预测器 api,用于端到端对象检测。要快速开始使用 YOLOX-PAI,请单击此处!
有关更多详细信息和历史记录,请参阅change_log.md。
安装请参考quick_start.md中的安装部分。
请参考quick_start.md快速入门。我们还提供了更多用法的教程。
笔记本
更多详情请参考以下模型动物园。
EasyCV 收集了不同场景的数据集信息,方便用户在 EasyCV modelzoo 中微调或评估模型。
请参考data_hub.md。
该项目在Apache 许可证(2.0 版)下获得许可。该工具包还包含各种第三方组件和一些在其他开源许可下从其他 repos 修改的代码。有关详细信息,请参阅NOTICE文件。
此 repo 目前由 PAI-CV 团队维护,您可以通过以下方式联系我们
EasyCV 是基于 PyTorch 的一体化计算机视觉工具箱,主要专注于自监督学习、基于 Transformer 的模型,以及主要的 CV 任务,包括图像分类、度量学习、目标检测、姿态估计等。
SOTA SSL 算法
EasyCV 在基于对比学习的自我监督学习中提供最先进的算法,例如 SimCLR、MoCO V2、Swav、DINO 以及基于蒙版图像建模的 MAE。我们还提供用于 ssl 模型评估的标准基准测试工具。
视觉变形金刚
EasyCV 旨在提供一种简单的方法来使用通过监督学习或自我监督学习训练的现成 SOTA 变压器模型,例如 ViT、Swin Transformer 和 DETR 系列。未来将添加更多模型。此外,我们支持来自timm的所有预训练模型。
功能和可扩展性
除了 SSL,EasyCV 还支持图像分类、物体检测、度量学习,未来将支持更多领域。虽然涵盖了不同的领域,但 EasyCV 将框架分解为不同的组件,例如数据集、模型和运行钩子,从而可以轻松添加新组件并将其与现有模块组合。
EasyCV 提供简单而全面的推理接口。此外, PAI-EAS支持所有模型,可以轻松部署为在线服务,并支持自动扩展和服务监控。
效率
EasyCV 支持多 GPU 和多工人训练。EasyCV 使用DALI加速数据 io 和预处理过程,并使用TorchAccelerator和 fp16 加速训练过程。对于推理优化,EasyCV 使用 jit 脚本导出模型,可以通过PAI-Blade进行优化
[��最新消息] 我们发布了我们的 YOLOX-PAI,它可以在 40~50 mAP(小于 1ms)内实现 SOTA 结果。我们还提供了一个方便快捷的导出/预测器 api,用于端到端对象检测。要快速开始使用 YOLOX-PAI,请单击此处!
有关更多详细信息和历史记录,请参阅change_log.md。
我们有一系列关于 EasyCV 功能的技术文章。
安装请参考quick_start.md中的安装部分。
请参考quick_start.md快速入门。我们还提供了更多用法的教程。
笔记本
更多详情请参考以下模型动物园。
EasyCV 收集了不同场景的数据集信息,方便用户在 EasyCV modelzoo 中微调或评估模型。
请参考data_hub.md。
该项目在Apache 许可证(2.0 版)下获得许可。该工具包还包含各种第三方组件和一些在其他开源许可下从其他 repos 修改的代码。有关详细信息,请参阅NOTICE文件。
此 repo 目前由 PAI-CV 团队维护,您可以通过以下方式联系我们
如果您需要EasyCV企业服务支持,或者购买云产品服务,可以通过钉钉集团联系我们。
本项目维护于github:https://github.com/eguid/easyCV 1、介绍 本项目基于javaCV1.4.x。 其中实现了 (1)实时视频截图服务(支持rtsp/rtmp/http-flv/hls/file等视频源),图片保存格式支持png/jpeg/jpg/gif等等,支持base64和图片保存两种方式,同时支持两种同时保存/返回。 (2)视频录像服务支持rtsp/rtm
导言 BEVFormer 是一种纯视觉的自动驾驶感知算法,通过融合环视相机图像的空间和时序特征显式的生成具有强表征能力的 BEV 特征,并应用于下游 3D 检测、分割等任务,取得了 SOTA 的结果。我们在 EasyCV 开源框架中,对 BEVFomer 算法进行集成,并从训练速度、算法收敛速度角度对代码进行了一些优化。同时,我们进一步使用推理优化工具 PAI-Blade 对模型进行优化,相比于原
7.24 笔试 8.11 一面 自我介绍 项目1介绍(深挖) 项目2介绍(深挖) 代码:找到离给定两个节点最近的节点(力扣2359) 8.29 二面 自我介绍 项目1介绍(细挖) 项目2介绍(细挖) 专利介绍 反问 9.1 HR面 自我介绍 家庭情况 大学生活 研究生生活 未来规划 对象问题 #虹软#
智能算法部 30min 看你实习用过SAM,讲一下原理 SAM模型的分割图目前没有语义标签,说一下改进的思路 说到了无监督语义分割,怎么实现的 讲一下实习做的工作 讲一下两篇论文的工作 讲一下医学图像分割与自然图像分割的区别与难点,近几年论文的研究方向 医学图像分割和自然图像分割的落地应用有哪些,落地的难点 dice系数怎么算 用过哪些分割损失,Lovasz loss用过没 未来想做研究还是做工程
没有填内推码 8.26 笔试 4道算法 A3.95 0903通知面试 0905 16.55开始面 面试官人贼好,上来说面试分三步 1. 介绍部门 2. 我介绍自己和实习内容,毕设项目 问了一些项目细节 3. 力扣 快速搜索 几分钟写完 17.25 结束面试 【我以为凉了KPI毕竟就面了30分钟,但是直接跟我说过了等通知二面...】 其中问了: 能不能实习,我觉得哪些事情是本科之后的转折点。
9.11 时长正好60min 首先百度是给我最魔幻体验的公司了,因为一开始自己投了另一个也叫计算机视觉的岗,两天就共享中了,结果前几天自己变更了职位给自己捞进来面试了,自己最近疯狂被简历挂收到面试已经属于正反馈了,就冲这一点我这网盘大会员得永久续费了 然后第二点,自己今天的外出任务出了点意外导致不能按原定时间来,本来没报希望问了下HR,结果HR真给我沟通延迟了一小时!呜呜呜度子这恩情你让我怎么还啊
时长:1h30min 因为岗位比较匹配所以问了不少,鼠鼠第一次面这么匹配的岗位,面试官很有水平,学到了很多东西。 1.自我介绍 2.深挖项目和实习,简历上提到的都问了,中间穿插了八股 1)具有旋转不变性的图像算法 2)transformer中为什么除以根号dk?dk怎么来的? 3)传统的图像处理方法有哪些? 4)滤波,去燥 5)中值滤波用在什么地方? 6)哪些滤波能保持边缘信息? 3.手撕lc69
7.15 笔试 7.20 一面 无自我介绍 介绍项目 Anchor-free标签匹配方式 小目标信息丢失问题 基线选择 模型压缩技术 代码 7.1 求均方根 7.2 Softmax函数 7.3 交叉熵损失函数 7.27 二面 自我介绍 项目介绍 传统方法如何处理多尺度目标共存问题 双模态语义分割框架 语义分割损失函数 语义分割常见问题 边界模糊问题 点云配准及应用 凉~ #陌陌面试#
更新:一面过了,求保佑🙏 ————————————————— 面试官是个6k引的老师,很犀利 首先双方自我介绍, 1.拷打论文 2.我说的啰哩啰嗦的,打开论文讲,讲贡献创新,三句话足够 3.拷打完问我怎么设计一个3d文生图pipeline,看得少乱扯 4.对图生图的了解(ip- adapter controlnet 5.ddpm与ddim区别(denoising区别, 6.为什么ddim比ddp
TCL小哥太和善了,全程体验极为舒适,可惜面的岗位主要做的是机器学习,不过也值得我学习 自我介绍 ======目标检测项目====== 项目介绍 预处理方法介绍,还了解哪些预处理方法 改进点是什么,为什么这么改进 为什么要是用mobilenet?精度上有提升吗,为什么?CBAM结构?这种结构还可以用在什么领域画质类任务了解吗? SPP结构有没有用,结果和原因 YOLOv1-v5系列详细说一下 ==