当前位置: 首页 > 知识库问答 >
问题:

Pytorch DataLoader中的采样器参数

巫马星雨
2023-03-14

在使用Pytorch的DataLoader实用程序时,在sampler中,RandomIdentitySampler的用途是什么?在randomintitysampler中有一个参数实例实例是否取决于工作人员的数量?如果有4个工人,那么是否也应该有4个实例?

以下是代码块:

c_dataloaders = DataLoader(Preprocessor(cluster_dataset.train_set,
                                        root=cluster_dataset.images_dir,
                                        transform=train_transformer),
                                        batch_size=args.batch_size_stage2,
                                        num_workers=args.workers,
                                        sampler=RandomIdentitySampler(cluster_dataset.train_set,
                                        args.batch_size_stage2,
                                        args.instances)

共有1个答案

白驰
2023-03-14

此采样器不是Pytork或任何其他官方lib(torchvision、torchtext等)的一部分。无论如何,在开阳州的torchreid中有一个randominiditysampler。假设情况如此:

  1. 在使用Pytorch的DataLoader实用程序时,在sampler中,RandomIdentitySampler的用途是什么
  • 正如您在DataLoader留档中看到的:采样器定义了从数据集中抽取样本的策略。更具体地说,它基于随机识别取样器留档,“随机取样N个身份,每个都有K个实例”。
  • 根据前面的答案,您可以注意到,实例并不取决于工作人员的数量。它只是为每个批次设置从数据集中提取的每个标识的实例数
  • 不一定。唯一的约束是实例的数量不应小于批处理大小。
 类似资料:
  • 我创建了一个定制的jmeter java采样器,它在循环中向HTTPendpoint发送请求并解析响应。希望多个线程在单个线程组中运行此采样器。 有人建议,我可以在安装线程组中使用beanshell采样器从csv读取,创建hashmap并使用之类的内容将其存储在JMeter属性中。有人能告诉我这是否是一个合理的方法吗?如果是,我如何访问自定义采样器中的特定JMeter属性? 我找到了这个答案:使用

  • 我有下面的JSR223采样器,它读取图像,稍微修改它,并发送一个POST multipart/form-data请求。与HTTP采样器相比,我发现它广泛使用了CPU,但我不能使用HTTP采样器,因为它不支持在不保存到文件系统的情况下更改映像。 如果任何人有任何输入来优化JSR223采样器中的脚本,这样它就不会占用大量的CPU,我将很感激。

  • 但是根据目前的需求,我们需要从mongodb中获取数据,将这些动态值传递给HTTP请求采样器,我的意思是我们需要根据数据库中的动态值构建HTTP请求采样器? 你能不能请谁帮我一下。

  • 在分布式跟踪中,数据量可能非常高,因此采样可能很重要(您通常不需要导出所有spans以获得正在发生的情况)。Spring Cloud Sleuth具有Sampler策略,您可以实现该策略来控制采样算法。采样器不会停止生成跨度(相关)ids,但是它们确实阻止了附加和导出的标签和事件。默认情况下,您将获得一个策略,如果跨度已经处于活动状态,则会继续跟踪,但新策略始终被标记为不可导出。如果您的所有应用程

  • 我已经在中获得了记录数,我只需要知道如何才能获得的数据 提前感谢!