DatabricksReposUpdateOperator¶
使用 DatabricksReposUpdateOperator 透過 api/2.0/repos/ API 端點,將現有 Databricks Repos 中的程式碼更新到指定的 Git 分支或標籤。
使用運算子¶
通常,此運算子用於在 Databricks 作業執行前更新其原始碼。要使用此運算子,您需要提供 branch 或 tag,以及 repo_path 或 repo_id。
引數 |
輸入 |
|---|---|
branch: str |
要更新到的現有 Git 分支名稱(如果未提供 |
tag: str |
要更新到的現有 Git 標籤名稱(如果未提供 |
repo_path: str |
現有 Databricks Repos 的路徑,例如 |
repo_id: str |
現有 Databricks Repos 的 ID(如果未提供 |
databricks_conn_id: string |
要使用的 Airflow 連線名稱。 |
databricks_retry_limit: integer |
如果 Databricks 後端不可達,重試的次數。 |
databricks_retry_delay: decimal |
每次重試之間等待的秒數。 |
示例¶
透過指定路徑更新 Databricks Repo¶
DatabricksReposUpdateOperator 的一個示例如下所示
tests/system/databricks/example_databricks_repos.py
# Example of updating a Databricks Repo to the latest code
repo_path = "/Repos/user@domain.com/demo-repo"
update_repo = DatabricksReposUpdateOperator(task_id="update_repo", repo_path=repo_path, branch="releases")