Microsoft Azure Data Factory¶
Microsoft Azure Data Factory 連線型別支援 Azure Data Factory 整合。
向 Azure Data Factory 進行身份驗證¶
有三種方法可以使用 Airflow 連線到 Azure Data Factory。
使用令牌憑據,即向 Airflow 連線新增特定憑據(client_id、secret、tenant)和訂閱 ID。
透過設定
managed_identity_client_id、workload_identity_tenant_id使用託管標識(內部使用 DefaultAzureCredential 並傳入這些引數)回退到 DefaultAzureCredential。這包含嘗試不同身份驗證選項的機制:託管系統標識、環境變數、透過 Azure CLI 進行身份驗證…
預設連線 ID¶
所有與 Microsoft Azure Data Factory 相關的 hook 和 operator 預設使用 azure_data_factory_default。
配置連線¶
- 客戶端 ID
指定用於初始連線的
client_id。令牌憑據身份驗證機制需要此項。可以省略以回退到 DefaultAzureCredential。- 金鑰
指定用於初始連線的
secret。令牌憑據身份驗證機制需要此項。可以省略以回退到 DefaultAzureCredential。- 租戶 ID
指定用於初始連線的 Azure 租戶 ID。令牌憑據身份驗證機制需要此項。可以省略以回退到 DefaultAzureCredential。使用 extra 引數
tenantId傳入租戶 ID。- 訂閱 ID
指定用於初始連線的訂閱 ID。所有身份驗證機制都需要此項。使用 extra 引數
subscriptionId傳入 Azure 訂閱 ID。- 工廠名稱(可選)
指定要與之互動的 Azure Data Factory。如果連線中未指定,則需要將其直接傳遞給 hook、operator 和 sensor。使用 extra 引數
factory_name傳入工廠名稱。- 資源組名稱(可選)
指定所需 data factory 所在的 Azure 資源組名稱。如果連線中未指定,則需要將其直接傳遞給 hook、operator 和 sensor。使用 extra 引數
resource_group_name傳入資源組名稱。- 託管標識客戶端 ID(可選)
使用者分配的託管標識的客戶端 ID。如果與
workload_identity_tenant_id一起提供,則會傳遞給 DefaultAzureCredential。- 工作負載標識租戶 ID(可選)
應用程式的 Microsoft Entra 租戶 ID。也稱為其“目錄”ID。如果與
managed_identity_client_id一起提供,則會傳遞給 DefaultAzureCredential。
在環境變數中指定連線時,應使用 URI 語法進行指定。
請注意,URI 的所有組成部分都應進行 URL 編碼。
示例¶
export AIRFLOW_CONN_AZURE_DATA_FACTORY_DEFAULT='azure-data-factory://applicationid:serviceprincipalpassword@?tenantId=tenant+id&subscriptionId=subscription+id&resource_group_name=group+name&factory_name=factory+name'
export AIRFLOW_CONN_AZURE_DATA_FACTORY_DEFAULT='azure-data-factory://applicationid:serviceprincipalpassword@?tenantId=tenant+id&subscriptionId=subscription+id'