airflow.providers.microsoft.azure.operators.synapse¶
類¶
在 Azure Synapse 上執行 Spark 作業。 |
|
構造一個連結以監控 Azure Synapse 中的管道執行。 |
|
執行 Synapse 管道。 |
模組內容¶
- class airflow.providers.microsoft.azure.operators.synapse.AzureSynapseRunSparkBatchOperator(*, azure_synapse_conn_id=AzureSynapseHook.default_conn_name, wait_for_termination=True, spark_pool='', payload, timeout=60 * 60 * 24 * 7, check_interval=60, **kwargs)[source]¶
基礎:
airflow.models.BaseOperator在 Azure Synapse 上執行 Spark 作業。
- 引數:
azure_synapse_conn_id (str) – 用於連線到 Azure Synapse 的連線識別符號。
wait_for_termination (bool) – 等待作業執行終止的標誌。
spark_pool (str) – 用於提交作業的目標 synapse spark 池
payload (azure.synapse.spark.models.SparkBatchJobOptions) – 與 Livy 相容的 payload,表示使用者想要提交的 spark 作業
timeout (int) – 對於非非同步等待,等待作業達到終端狀態的超時時間(秒)。僅當
wait_for_termination為 True 時使用。check_interval (int) – 對於非非同步等待,檢查作業執行狀態的時間間隔(秒)。僅當
wait_for_termination為 True 時使用。
- template_fields: collections.abc.Sequence[str] = ('azure_synapse_conn_id', 'spark_pool')[source]¶
- class airflow.providers.microsoft.azure.operators.synapse.AzureSynapsePipelineRunLink[source]¶
基礎:
airflow.sdk.BaseOperatorLink構造一個連結以監控 Azure Synapse 中的管道執行。
- get_fields_from_url(workspace_url)[source]¶
從 Synapse 工作區 URL 中提取 workspace_name、subscription_id 和 resource_group。
- 引數:
workspace_url – 工作區 URL。
- get_link(operator, *, ti_key)[source]¶
連結到外部系統。
- 引數:
operator (airflow.models.BaseOperator) – 此連結關聯的 Airflow operator 物件。
ti_key (airflow.models.taskinstancekey.TaskInstanceKey) – 返回連結的任務例項 ID。
- 返回:
到外部系統的連結
- class airflow.providers.microsoft.azure.operators.synapse.AzureSynapseRunPipelineOperator(pipeline_name, azure_synapse_conn_id, azure_synapse_workspace_dev_endpoint, wait_for_termination=True, reference_pipeline_run_id=None, is_recovery=None, start_activity_name=None, parameters=None, timeout=60 * 60 * 24 * 7, check_interval=60, **kwargs)[source]¶
基礎:
airflow.models.BaseOperator執行 Synapse 管道。
- 引數:
pipeline_name (str) – 要執行的管道名稱。
azure_synapse_conn_id (str) – Azure Synapse 的 Airflow 連線 ID。
azure_synapse_workspace_dev_endpoint (str) – Azure Synapse 工作區開發端點。
wait_for_termination (bool) – 等待管道執行終止的標誌。
reference_pipeline_run_id (str | None) – 管道執行識別符號。如果指定此執行 ID,將使用指定執行的引數建立一個新執行。
is_recovery (bool | None) – 恢復模式標誌。如果恢復模式設定為 True,指定的引用管道執行和新執行將歸入同一個
groupId下。start_activity_name (str | None) – 在恢復模式下,重跑將從這個活動開始。如果未指定,所有活動都將執行。
parameters (dict[str, Any] | None) – 管道執行的引數。這些引數在管道中透過
@pipeline().parameters.parameterName引用,並且僅在未指定reference_pipeline_run_id時使用。timeout (int) – 對於非非同步等待,等待管道達到終端狀態的超時時間(秒)。僅當
wait_for_termination為 True 時使用。check_interval (int) – 對於非非同步等待,檢查管道執行狀態的時間間隔(秒)。僅當
wait_for_termination為 True 時使用。
- template_fields: collections.abc.Sequence[str] = ('azure_synapse_conn_id',)[source]¶