问题：

Azure Databricks作业的DevOps

松琦

2023-03-14

我正在尝试在Azure Databricks上实现DevOps。

我已经完成了datricks笔记本和dbfs文件的devops实现。

我确实有许多数据砖作业根据计划在我的集群上运行。其中一些作业指向笔记本文件，少数作业指向 dbfs 位置中的 jar 文件。

有没有办法在azure databricks作业上实现devops流程，以便DEV中任何作业的任何更改都将调用构建管道，并在PROD databricks实例中部署相同的管道。

首先，我想知道是否有可能在 Azure 数据砖作业上实现 DevOps。

任何线索赞赏！

共有1个答案

陆烨磊

2023-03-14

为了有效地做到这一点，我建议使用Databricks Terraform提供程序 - 在这种情况下，作业的定义可以存储在Git或类似的东西中，然后很容易与CI / CD系统集成，例如Azure DevOps，GitHub操作等。

环境之间的差异可以被编码为具有不同文件的变量，这些文件包含不同环境的html" target="_blank">变量等，因此您可以在不同环境之间重用主代码，如下所示：

provider "databricks" {
  host  = var.db_host
  token = var.db_token
}

data "databricks_spark_version" "latest" {}
data "databricks_node_type" "smallest" {
  local_disk = true
}

resource "databricks_job" "this" {
  name = "Job"

  new_cluster {
    num_workers   = 1
    spark_version = data.databricks_spark_version.latest.id
    node_type_id  = data.databricks_node_type.smallest.id
  }

  notebook_task {
    notebook_path = "path_to_notebook"
  }

  email_notifications {}
}

附言：从理论上讲，您可以实现一些定期任务，该任务将从原始环境中提取作业定义，并检查作业定义是否已更改，并将更改应用于另一个环境。你甚至可以通过诊断日志跟踪对作业定义的更改，并将其用作触发器。

但所有这些都只是黑客 - 最好使用Terraform。

类似资料：

Quartz作业的Cron作业语法
作业

1. Redis是什么、特点、优势 Redis是一个开源的使用C语言编写、开源、支持网络、可基于内存亦可持久化的日志型、高性能的Key-Value数据库，并提供多种语言的API。它通常被称为数据结构服务器，因为值（value）可以是字符串(String)、哈希(Map)、列表(list)、集合(sets) 和有序集合(sorted sets)等类型。 Redis 与其他 key - v
Laravel作业覆盖其他作业？

我不太确定该怎么写，但我有一个名为的工作，它使用CloudConvert将上传的文件（例如PDF）转换为JPG。单独使用，效果很好。我可以上传一个文件，它将被保存到S3，然后CloudConvert获取S3文件，转换它并上传它。完美。有人知道我可以尝试什么吗？我甚至不确定从哪里开始调试它。
作业帮

8.22 一面没有自我介绍 1、实习项目（低代码...） 2、项目有没有上线？（讲了一下项目的具体思路） 3、顺项目提问：熟悉的设计模式？docker？ 4、了解的数据结构，树搜索的时间复杂度（没回答好） 5、计组：并行和并发，CPU如何工作 6、TS 语言编译过程（讲了一下编译的几个步骤） 7、计算机网络七层模型、UDP、TCP 8、浏览器缓存（强缓存、协商缓存） 9、登录的 token 在
pandas：链接的作业

问题内容：我一直在阅读这个链接的“返回视图与副本”。我真的不明白的是如何链接分配在熊猫的概念工作和如何的使用，或者影响它。我收到以下代码行的警告，其中Panda数据框是该数据框中的列（系列）名称：看这段代码，很明显我做的不是次优的吗？如果是这样，您能告诉我替换代码行吗？我知道以下警告，并希望认为我的警告是误报：链接的作业警告/异常旨在通知用户可能无效的作业。可能存在误报；意外报告链接
ElasticSearch：ElasticSearch.Service的作业失败

我目前正在尝试为一个项目设置Elasticsearch。我已经安装了，还安装了Java，即。但是当我尝试使用以下命令启动Elasticsearch时我得到以下错误 loaded：loaded（/usr/lib/systemd/system/elasticsearch.service；disabled；vend 活动：自世界协调时2019-11-01 06:09:54开始失败（结果：退出-代码）

Azure Databricks作业的DevOps

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档