当前位置: 首页 > 知识库问答 >
问题:

如何处理入口点嵌套在文件夹与亚马逊sagemaker pytorch估计?

百里默
2023-03-14

我试图运行一个培训工作,在亚马逊sagemaker使用python-sagemaker-sdk,估计类。

我有以下几点

estimator = PyTorch(entry_point='training_scripts/train_MSCOCO.py',
                            source_dir='./',
                            role=#dummy_role,
                            train_instance_type='ml.p3.2xlarge',
                            train_instance_count=1,
                            framework_version='1.0.0',
                            output_path=#dummy_output_path,
                            hyperparameters={'lr': 0.001,
                                             'batch_size': 32,
                                             'num_workers': 4,
                                             'description': description})

角色和output_path隐藏隐私。

我得到以下错误,“没有名为training_scripts\train_MSCOCO的模块”。

当我运行python-m训练脚本时。训练MSCOCO脚本运行良好。但是当我通过entry\u point='training\u脚本时。火车站。py它不会作为“无文件名”培训脚本运行。火车站。py“在目录中找到”/"".

我对如何在AWS sagemaker中从存储库的顶层运行嵌套培训脚本感到困惑,因为它们似乎有相互冲突的路径需求,一个是python模块点表示法,另一个是标准文件路径斜杠表示法。

共有1个答案

宗弘扬
2023-03-14

其中任何一项都将起作用:

estimator = PyTorch(entry_point='training_scripts/train_MSCOCO.py',
                    role=#dummy_role,
                    ...

estimator = PyTorch(entry_point='train_MSCOCO.py',
                    source_dir='training_scripts',
                    role=#dummy_role,
                    ...
 类似资料:
  • 题型:全英文编程题(核心代码模式) 题目1: 游戏通过的意思,给出每通一关,需要消耗p[i]血,不能让血掉为0,其中有一关可以使用盾牌加血(x),求闯关开始最少血量。 例如: p={1,2,6,7};x=5; 12-1=11;11-2=9;9-6+5=8

  • 我目前正在使用AWS SageMaker Python SDK来训练EfficientNet模型(https://github.com/qubvel/efficientnet)我的数据。具体来说,我使用张量流估计器如下。此代码位于SageMaker笔记本实例中 火车的代码。py包含通常的训练过程,从S3中获取图像和标签,将它们转换为正确的数组形状以进行EfficientNet输入,并拆分为训练集、

  • 亚马逊云 图 1.20.2.1 - AWS AWS,即 Amazon Web Services,是亚马逊(Amazon)公司的 IaaS 和 PaaS 平台服务。AWS 提供了一整套基础设施和应用程序服务,使用户几乎能够在云中运行一切应用程序:从企业应用程序和大数据项目,到社交游戏和移动应用程序。AWS 面向用户提供包括弹性计算、存储、数据库、应用程序在内的一整套云计算服务,能够帮助企业降低 IT

  • 对不起我的英语。 我是Alexa技能实施新手。 我想将一个文本文件(已放置在AWS S3存储中)导入到代码中,以便能够读取它并将其插入到数据帧中,但我无法执行此操作。 我有这个密码 意图的调用应该返回一个链接,我认为(?) 当技能运行时,输出是“抱歉,我在做你要求的事情时遇到了麻烦。请再试一次。" 我希望获取链接,打开它,阅读它并创建一个数据帧。 有人能帮我吗?

  • 问题内容: 我有一个800KB的JPG文件。我尝试上传到S3,并不断收到超时错误。你能弄清楚哪里出了问题吗?800KB很小,无法上传。 错误消息:在超时期限内未读取或写入到服务器的套接字连接。空闲连接将关闭。 HTTP状态码:400 AWS错误代码:RequestTimeout 问题答案: IOUtils.toByteArray是否有可能正在耗尽您的输入流,以便在进行服务调用时不再需要从中读取任何

  • 我想问alexa各种各样的问题,最后我想让它问“你还有什么想知道的吗?”当我说“是”(yes是工作建议)时,它应该根据我的意图来建议我。就像我在