当前位置: 首页 > 知识库问答 >
问题:

Azure Databricks作业的DevOps

松琦
2023-03-14

我正在尝试在Azure Databricks上实现DevOps。

我已经完成了datricks笔记本和dbfs文件的devops实现。

我确实有许多数据砖作业根据计划在我的集群上运行。其中一些作业指向笔记本文件,少数作业指向 dbfs 位置中的 jar 文件。

有没有办法在azure databricks作业上实现devops流程,以便DEV中任何作业的任何更改都将调用构建管道,并在PROD databricks实例中部署相同的管道。

首先,我想知道是否有可能在 Azure 数据砖作业上实现 DevOps。

任何线索赞赏!

共有1个答案

陆烨磊
2023-03-14

为了有效地做到这一点,我建议使用Databricks Terraform提供程序 - 在这种情况下,作业的定义可以存储在Git或类似的东西中,然后很容易与CI / CD系统集成,例如Azure DevOps,GitHub操作等。

环境之间的差异可以被编码为具有不同文件的变量,这些文件包含不同环境的html" target="_blank">变量等,因此您可以在不同环境之间重用主代码,如下所示:

provider "databricks" {
  host  = var.db_host
  token = var.db_token
}

data "databricks_spark_version" "latest" {}
data "databricks_node_type" "smallest" {
  local_disk = true
}

resource "databricks_job" "this" {
  name = "Job"

  new_cluster {
    num_workers   = 1
    spark_version = data.databricks_spark_version.latest.id
    node_type_id  = data.databricks_node_type.smallest.id
  }

  notebook_task {
    notebook_path = "path_to_notebook"
  }

  email_notifications {}
}

附言:从理论上讲,您可以实现一些定期任务,该任务将从原始环境中提取作业定义,并检查作业定义是否已更改,并将更改应用于另一个环境。你甚至可以通过诊断日志跟踪对作业定义的更改,并将其用作触发器。

但所有这些都只是黑客 - 最好使用Terraform。

 类似资料:
  • 1. Redis是什么、特点、优势 Redis是一个开源的使用C语言编写、开源、支持网络、可基于内存亦可持久化的日志型、高性能的Key-Value数据库,并提供多种语言的API。 它通常被称为 数据结构服务器 ,因为值(value)可以是 字符串(String)、哈希(Map)、 列表(list)、集合(sets) 和 有序集合(sorted sets)等类型。 Redis 与其他 key - v

  • 我不太确定该怎么写,但我有一个名为的工作,它使用CloudConvert将上传的文件(例如PDF)转换为JPG。 单独使用,效果很好。我可以上传一个文件,它将被保存到S3,然后CloudConvert获取S3文件,转换它并上传它。完美。 有人知道我可以尝试什么吗?我甚至不确定从哪里开始调试它。

  • 8.22 一面 没有自我介绍 1、实习项目(低代码...) 2、项目有没有上线?(讲了一下项目的具体思路) 3、顺项目提问:熟悉的设计模式?docker? 4、了解的数据结构,树搜索的时间复杂度(没回答好) 5、计组:并行和并发,CPU如何工作 6、TS 语言 编译过程(讲了一下编译的几个步骤) 7、计算机网络七层模型、UDP、TCP 8、浏览器缓存(强缓存、协商缓存) 9、登录的 token 在

  • 问题内容: 我一直在阅读这个链接的“返回视图与副本”。我真的不明白的是如何 链接分配 在熊猫的概念工作和如何的使用,或者影响它。 我收到以下代码行的警告,其中Panda数据框是该数据框中的列(系列)名称: 看这段代码,很明显我做的不是次优的吗?如果是这样,您能告诉我替换代码行吗? 我知道以下警告,并希望认为我的警告是误报: 链接的作业警告/异常旨在通知用户可能无效的作业。可能存在误报;意外报告链接

  • 我目前正在尝试为一个项目设置Elasticsearch。我已经安装了,还安装了Java,即。 但是当我尝试使用以下命令启动Elasticsearch时 我得到以下错误 loaded:loaded(/usr/lib/systemd/system/elasticsearch.service;disabled;vend 活动:自世界协调时2019-11-01 06:09:54开始失败(结果:退出-代码)