当前位置: 首页 > 知识库问答 >
问题:

AWS Glue与其开发endpoint之间的差异

佟寒
2023-03-14

我的理解是AWS Glue中的Dev Endpoint可用于迭代开发代码,然后将其部署到Glue作业中。我发现这在开发Spark作业时特别有用,因为每次运行作业时,都需要几分钟才能在后台启动Hadoop集群。但是,在Glue中使用Python shell而不是Spark时,我看到了差异。导入pg在我使用Sagemaker JupyterLab Python笔记本创建的Dev Endpoint中不起作用,但在我使用Python shell创建作业时在AWS Glue中起作用。Glue中存在的开发endpoint中不应该存在相同的库吗?如果您不能在两个地方(开发endpoint和胶水作业)复制相同的代码,那么拥有开发endpoint有什么意义?

共有1个答案

壤驷喜
2023-03-14

首先,Python shell作业不会在后端启动Hadooo集群,因为它不会为作业提供Spark环境。其次,由于PyGreSQL不是用纯Python编写的,因此它不能与Glue的本机环境(Glue Spark作业、Devendpoint等)一起工作。第三,pythonshell对某些内置包有额外的支持。

因此,我看不到将DevEndpoint用于Python Shell作业的意义。

 类似资料:
  • 但现在我无法决定它应该是普通的还是自定义的执行器。这两个术语有什么区别? ps:问题似乎是有意见基础的,但答案应该足够简单。

  • 在swift中似乎有两个相等运算符:双相等()和三相等(),这两者有什么区别?

  • 本文向大家介绍软件开发中产品与流程之间的差异,包括了软件开发中产品与流程之间的差异的使用技巧和注意事项,需要的朋友参考一下 产品 产品是软件开发过程的最终结果。产品是根据客户的要求/要求构建的。 处理 该过程是创建产品所遵循的一组步骤。流程是一个模板,可用于以类似方式创建多个产品。 以下是产品和过程之间的一些重要区别。 序号 键 产品 处理 1 概念 产品是开发周期的最终结果。 该过程是创建产品应

  • 嗨,我对时区没有什么疑问: null 我在维基百科和许多相关网站上搜索过,但没有找到相关的解释

  • 什么时候只能使用其中的一个? 何时可以同时使用和如何选择一个?

  • 方法接受一个供应商函数接口,该接口本质上不接受任何参数,并返回。 在哪种情况下需要使用?如果您有一个方法为什么不直接执行而不执行? 似乎并不是要将lambda表达式的执行推迟到以后的某个时间或其他时间,那么这有什么意义呢?(我认为如果它返回一个更安全的会更有用,它的从不抛出并且总是返回true...但显然它不是,它只是返回,就像)。 是不是还有什么我遗漏的不同之处?