DatabricksReposUpdateOperator

使用 DatabricksReposUpdateOperator 透過 api/2.0/repos/ API 端點,將現有 Databricks Repos 中的程式碼更新到指定的 Git 分支或標籤。

使用運算子

通常,此運算子用於在 Databricks 作業執行前更新其原始碼。要使用此運算子,您需要提供 branchtag,以及 repo_pathrepo_id

引數

輸入

branch: str

要更新到的現有 Git 分支名稱(如果未提供 tag,則必需)。

tag: str

要更新到的現有 Git 標籤名稱(如果未提供 branch,則必需)。

repo_path: str

現有 Databricks Repos 的路徑,例如 /Repos/<user_email>/repo_name(如果未提供 repo_id,則必需)。

repo_id: str

現有 Databricks Repos 的 ID(如果未提供 repo_path,則必需)。

databricks_conn_id: string

要使用的 Airflow 連線名稱。

databricks_retry_limit: integer

如果 Databricks 後端不可達,重試的次數。

databricks_retry_delay: decimal

每次重試之間等待的秒數。

示例

透過指定路徑更新 Databricks Repo

DatabricksReposUpdateOperator 的一個示例如下所示

tests/system/databricks/example_databricks_repos.py

    # Example of updating a Databricks Repo to the latest code
    repo_path = "/Repos/user@domain.com/demo-repo"
    update_repo = DatabricksReposUpdateOperator(task_id="update_repo", repo_path=repo_path, branch="releases")

本條目對您有幫助嗎?