当前位置: 首页 > 知识库问答 >
问题:

SageMaker的FensorFlow培训工作-如何更改脚本归档路径?

毛镜
2023-03-14

也许有人遇到过这样的问题:当sagemaker.tensorflow.TensorFlow类在SageMaker中创建一个训练作业时,我需要设置一个参数,负责在S3中保存训练脚本代码,以便其路径精确:sagemaker_submit_directory或可能module_dir-我不确定。默认情况下,它看起来像这样:

s3: //bucket/job-name/source/sourcedir.tar.gz. 

我需要在bucket name和job name之间加上一些东西。我怎么做?我试图将这样的参数添加到hyperparameters中,但是我的培训工作非常困难(不幸的是,无法读取整个错误消息,因为堆栈跟踪大于限制,我无法完全看到它)?

有什么想法吗?

共有1个答案

史绍晖
2023-03-14

好吧,我没有足够的耐心搜索文档。以下是参数“代码位置”的答案:

https://sagemaker.readthedocs.io/en/stable/api/training/estimators.html?highlight=code_location#sagemaker.estimator.Framework

 类似资料:
  • 我想在SageMaker找一份当地的培训工作。 根据这个AWS笔记本(https://github.com/awslabs/amazon-sagemaker-examples/blob/master/sagemaker-python-sdk/mxnet_gluon_mnist/mxnet_mnist_with_gluon_local_mode.ipynb),我能够在本地进行训练和预测。 有没有办法

  • 我试图在AWS上运行自定义python/skLearning sagemaker脚本,基本上从这些例子中学习:https://github.com/aws/amazon-sagemaker-examples/blob/master/sagemaker-python-sdk/scikit_learn_randomforest/Sklearn_on_SageMaker_end2end.ipynb 如果

  • 我对SageMaker有以下挑战: > 我已经下载了一个教程笔记本(https://github.com/awslabs/amazon-sagemaker-examples/blob/master/sagemaker-python-sdk/tensorflow_abalone_age_predictor_using_keras/tensorflow_abalone_age_predictor_us

  • 我想在aws sagemaker上培训YOLOv5,还要在sagemaker上部署模型,还需要了解entrypoint python脚本。我如何为此构建管道?

  • 我正在尝试创建自己的定制Sagemaker框架,该框架运行定制python脚本,以使用entry_point参数训练ML模型。 遵循pythonsdk文档(https://sagemaker.readthedocs.io/en/stable/estimators.html),我编写了运行培训作业的最简单代码,只是为了了解它的行为以及Sagemaker框架的工作方式。 我的问题是,我不知道如何正确构

  • 我有一些python代码,它使用tensorflow训练神经网络。 我基于运行python脚本的tensorflow/tensorflow:latest-gpu-py3映像创建了一个docker映像。当我启动EC2P2时。xlarge实例我可以使用以下命令运行docker容器 包含我的代码的容器运行时没有错误,并且使用主机GPU。 问题是,当我尝试使用实例ml.p2.xlarge在AWS Sage