airflow.providers.google.cloud.hooks.datafusion¶
此模組包含 Google DataFusion Hook。
屬性¶
異常¶
捕獲 409 錯誤的異常。 |
類¶
Data Fusion 流水線狀態。 |
|
Google DataFusion 的 Hook。 |
|
獲取 DataFusion 非同步 Hook 的類。 |
模組內容¶
- exception airflow.providers.google.cloud.hooks.datafusion.ConflictException[原始碼]¶
基類:
airflow.exceptions.AirflowException捕獲 409 錯誤的異常。
- class airflow.providers.google.cloud.hooks.datafusion.DataFusionHook(api_version='v1beta1', gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[原始碼]¶
基類:
airflow.providers.google.common.hooks.base_google.GoogleBaseHookGoogle DataFusion 的 Hook。
- wait_for_pipeline_state(pipeline_name, pipeline_id, instance_url, pipeline_type=DataFusionPipelineType.BATCH, namespace='default', success_states=None, failure_states=None, timeout=5 * 60)[原始碼]¶
輪詢流水線狀態,如果狀態失敗或超時則丟擲異常。
- create_instance(instance_name, instance, location, project_id=PROVIDE_PROJECT_ID)[原始碼]¶
在指定的專案和位置建立新的 Data Fusion 例項。
- patch_instance(instance_name, instance, update_mask, location, project_id=PROVIDE_PROJECT_ID)[原始碼]¶
更新單個 Data Fusion 例項。
- 引數:
instance_name (str) – 要建立的例項名稱。
instance (dict[str, Any]) – 一個 Instance 例項。 https://cloud.google.com/data-fusion/docs/reference/rest/v1beta1/projects.locations.instances#Instance
update_mask (str) – 欄位掩碼用於指定更新將覆蓋例項資源中的哪些欄位。updateMask 中指定的欄位是相對於資源的,而非完整的請求。如果欄位位於掩碼中,則將被覆蓋。如果使用者未提供掩碼,則所有支援的欄位(目前為 labels 和 options)都將被覆蓋。這是一個逗號分隔的完全限定欄位名稱列表。示例:“user.displayName,photo”。 https://developers.google.com/protocol-buffers/docs/reference/google.protobuf?_ga=2.205612571.-968688242.1573564810#google.protobuf.FieldMask
location (str) – 處理請求的 Cloud Data Fusion 位置。
project_id (str) – 例項所屬的 Google Cloud 專案 ID。
- create_pipeline(pipeline_name, pipeline, instance_url, namespace='default')[原始碼]¶
建立批次 Cloud Data Fusion 流水線。
- 引數:
pipeline_name (str) – 您的流水線名稱。
pipeline (dict[str, Any]) – 流水線定義。欲瞭解更多資訊,請參閱:https://docs.cdap.io/cdap/current/en/developer-manual/pipelines/developing-pipelines.html#pipeline-configuration-file-format
instance_url (str) – 例項上可訪問 REST API 的端點。
namespace (str) – 如果您的流水線屬於基礎版例項,則名稱空間 ID 始終為 default。如果您的流水線屬於企業版例項,則可以建立名稱空間。
- delete_pipeline(pipeline_name, instance_url, version_id=None, namespace='default')[原始碼]¶
刪除批次 Cloud Data Fusion 流水線。
- list_pipelines(instance_url, artifact_name=None, artifact_version=None, namespace='default')[原始碼]¶
列出 Cloud Data Fusion 流水線。
- get_pipeline_workflow(pipeline_name, instance_url, pipeline_id, pipeline_type=DataFusionPipelineType.BATCH, namespace='default')[原始碼]¶
- start_pipeline(pipeline_name, instance_url, pipeline_type=DataFusionPipelineType.BATCH, namespace='default', runtime_args=None)[原始碼]¶
啟動 Cloud Data Fusion 流水線。適用於批次和流式流水線。
- 引數:
pipeline_name (str) – 您的流水線名稱。
pipeline_type (airflow.providers.google.cloud.utils.datafusion.DataFusionPipelineType) – 可選的流水線型別(預設為 BATCH)。
instance_url (str) – 例項上可訪問 REST API 的端點。
runtime_args (dict[str, Any] | None) – 要傳遞給流水線的可選執行時 JSON 引數
namespace (str) – 如果您的流水線屬於基礎版例項,則名稱空間 ID 始終為 default。如果您的流水線屬於企業版例項,則可以建立名稱空間。
- stop_pipeline(pipeline_name, instance_url, namespace='default')[原始碼]¶
停止 Cloud Data Fusion 流水線。適用於批次和流式流水線。
- static cdap_program_type(pipeline_type)[原始碼]¶
根據流水線型別檢索 CDAP 程式型別。
- 引數:
pipeline_type (airflow.providers.google.cloud.utils.datafusion.DataFusionPipelineType) – 流水線型別。
- static cdap_program_id(pipeline_type)[原始碼]¶
根據流水線型別檢索 CDAP 程式 ID。
- 引數:
pipeline_type (airflow.providers.google.cloud.utils.datafusion.DataFusionPipelineType) – 流水線型別。
- class airflow.providers.google.cloud.hooks.datafusion.DataFusionAsyncHook(**kwargs)[原始碼]¶
基類:
airflow.providers.google.common.hooks.base_google.GoogleBaseAsyncHook獲取 DataFusion 非同步 Hook 的類。
- async get_pipeline(instance_url, namespace, pipeline_name, pipeline_id, session, pipeline_type=DataFusionPipelineType.BATCH)[原始碼]¶
- async get_pipeline_status(pipeline_name, instance_url, pipeline_id, pipeline_type=DataFusionPipelineType.BATCH, namespace='default', success_states=None)[原始碼]¶
非同步獲取 Cloud Data Fusion 流水線狀態。
- 引數:
pipeline_name (str) – 您的流水線名稱。
instance_url (str) – 例項上可訪問 REST API 的端點。
pipeline_id (str) – 與特定流水線關聯的唯一流水線 ID。
pipeline_type (airflow.providers.google.cloud.utils.datafusion.DataFusionPipelineType) – 可選的流水線型別(預設為 batch)。
namespace (str) – 如果您的流水線屬於基礎版例項,則名稱空間 ID 始終為 default。如果您的流水線屬於企業版例項,則可以建立名稱空間。
success_states (list[str] | None) – 如果提供,operator 將等待流水線進入提供的狀態之一。