airflow.providers.google.cloud.operators.dataplex¶
此模組包含 Google Dataplex 運算子。
類¶
在 lake 中建立一個 task 資源。 |
|
刪除 task 資源。 |
|
列出指定 lake 下的 tasks。 |
|
獲取 task 資源。 |
|
在 lake 中建立一個 lake 資源。 |
|
刪除 lake 資源。 |
|
建立一個 DataScan 資源。 |
|
獲取 DataScan 資源。 |
|
刪除 DataScan 資源。 |
|
執行 DataScan 的按需執行。 |
|
獲取 Data Scan Job 資源。 |
|
建立一個 DataScan Data Profile 資源。 |
|
獲取 DataScan DataProfile 資源。 |
|
刪除 DataScan DataProfile 資源。 |
|
執行 DataScan Data Profile Scan 的按需執行。 |
|
獲取 DataScan Data Profile Job 資源。 |
|
在 Lake 中建立一個 Zone 資源。 |
|
刪除 Zone 資源。必須先刪除 Zone 內的所有 assets,然後才能刪除 Zone。 |
|
建立一個 Asset 資源。 |
|
刪除 asset 資源。 |
|
所有 Dataplex Catalog 運算子的基類。 |
|
建立一個 EntryGroup 資源。 |
|
獲取 EntryGroup 資源。 |
|
刪除 EntryGroup 資源。 |
|
列出 EntryGroup 資源。 |
|
更新 EntryGroup 資源。 |
|
建立一個 EntryType 資源。 |
|
獲取 EntryType 資源。 |
|
刪除 EntryType 資源。 |
|
列出 EntryType 資源。 |
|
更新 EntryType 資源。 |
|
建立一個 AspectType 資源。 |
|
獲取 AspectType 資源。 |
|
列出 AspectType 資源。 |
|
更新 AspectType 資源。 |
|
刪除 AspectType 資源。 |
|
建立一個 Entry 資源。 |
|
獲取 Entry 資源。 |
|
列出 Entry 資源。 |
|
根據指定的查詢和範圍搜尋 Entries。 |
|
使用源系統上的許可權按名稱查詢單個 Entry。 |
|
更新 Entry 資源。 |
|
刪除 Entry 資源。 |
模組內容¶
- class airflow.providers.google.cloud.operators.dataplex.DataplexCreateTaskOperator(project_id, region, lake_id, body, dataplex_task_id, validate_only=None, api_version='v1', retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, asynchronous=False, *args, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator在 lake 中建立一個 task 資源。
- 引數:
project_id (str) – 必需。Task 所屬的 Google Cloud 專案的 ID。
region (str) – 必需。Task 所屬的 Google Cloud 區域的 ID。
lake_id (str) – 必需。Task 所屬的 Google Cloud lake 的 ID。
dataplex_task_id (str) – 必需。Task 識別符號。
validate_only (bool | None) – 可選。僅驗證請求,但不執行更改。預設為 false。
api_version (str) – 將請求的 API 版本,例如 'v3'。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout (float | None) – 等待請求完成的時間量,以秒為單位。請注意,如果指定了 retry,則超時應用於每次單獨的嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供給方法的附加元資料。
gcp_conn_id (str) – 獲取連線資訊時使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選。用於使用短期憑據進行身份模擬的服務賬號,或獲取列表中最後一個賬號的 access_token 所需的鏈式賬號列表,該賬號將在請求中被模擬。如果設定為字串,該賬號必須授予源賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須向直接前置的身份授予 Service Account Token Creator IAM 角色,其中列表中的第一個賬號將此角色授予源賬號(模板化)。
asynchronous (bool) – 指示是否應非同步建立 Dataplex task 的標誌。這對於長時間執行的建立 tasks 並使用 DataplexTaskSensor 非同步等待它們非常有用。
- class airflow.providers.google.cloud.operators.dataplex.DataplexDeleteTaskOperator(project_id, region, lake_id, dataplex_task_id, api_version='v1', retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, *args, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator刪除 task 資源。
- 引數:
project_id (str) – 必需。Task 所屬的 Google Cloud 專案的 ID。
region (str) – 必需。Task 所屬的 Google Cloud 區域的 ID。
lake_id (str) – 必需。Task 所屬的 Google Cloud lake 的 ID。
dataplex_task_id (str) – 必需。Task 識別符號。
api_version (str) – 將請求的 API 版本,例如 'v3'。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout (float | None) – 等待請求完成的時間量,以秒為單位。請注意,如果指定了 retry,則超時應用於每次單獨的嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供給方法的附加元資料。
gcp_conn_id (str) – 獲取連線資訊時使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選。用於使用短期憑據進行身份模擬的服務賬號,或獲取列表中最後一個賬號的 access_token 所需的鏈式賬號列表,該賬號將在請求中被模擬。如果設定為字串,該賬號必須授予源賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須向直接前置的身份授予 Service Account Token Creator IAM 角色,其中列表中的第一個賬號將此角色授予源賬號(模板化)。
- class airflow.providers.google.cloud.operators.dataplex.DataplexListTasksOperator(project_id, region, lake_id, page_size=None, page_token=None, filter=None, order_by=None, api_version='v1', retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, *args, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator列出指定 lake 下的 tasks。
- 引數:
project_id (str) – 必需。Task 所屬的 Google Cloud 專案的 ID。
region (str) – 必需。Task 所屬的 Google Cloud 區域的 ID。
lake_id (str) – 必需。Task 所屬的 Google Cloud lake 的 ID。
page_size (int | None) – 可選。要返回的最大 tasks 數量。服務返回的數量可能少於此值。如果未指定,則最多返回 10 個 tasks。最大值為 1000;超過 1000 的值將被強制設定為 1000。
page_token (str | None) – 可選。從之前的 ListZones 呼叫接收到的頁面令牌。提供此令牌可檢索後續頁面。分頁時,提供給 ListZones 的所有其他引數必須與提供頁面令牌的呼叫相匹配。
filter (str | None) – 可選。過濾請求。
order_by (str | None) – 可選。結果的排序欄位。
api_version (str) – 將請求的 API 版本,例如 'v3'。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout (float | None) – 等待請求完成的時間量,以秒為單位。請注意,如果指定了 retry,則超時應用於每次單獨的嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供給方法的附加元資料。
gcp_conn_id (str) – 獲取連線資訊時使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選。用於使用短期憑據進行身份模擬的服務賬號,或獲取列表中最後一個賬號的 access_token 所需的鏈式賬號列表,該賬號將在請求中被模擬。如果設定為字串,該賬號必須授予源賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須向直接前置的身份授予 Service Account Token Creator IAM 角色,其中列表中的第一個賬號將此角色授予源賬號(模板化)。
- class airflow.providers.google.cloud.operators.dataplex.DataplexGetTaskOperator(project_id, region, lake_id, dataplex_task_id, api_version='v1', retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, *args, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator獲取 task 資源。
- 引數:
project_id (str) – 必需。Task 所屬的 Google Cloud 專案的 ID。
region (str) – 必需。Task 所屬的 Google Cloud 區域的 ID。
lake_id (str) – 必需。Task 所屬的 Google Cloud lake 的 ID。
dataplex_task_id (str) – 必需。Task 識別符號。
api_version (str) – 將請求的 API 版本,例如 'v3'。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout (float | None) – 等待請求完成的時間量,以秒為單位。請注意,如果指定了 retry,則超時應用於每次單獨的嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供給方法的附加元資料。
gcp_conn_id (str) – 獲取連線資訊時使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選。用於使用短期憑據進行身份模擬的服務賬號,或獲取列表中最後一個賬號的 access_token 所需的鏈式賬號列表,該賬號將在請求中被模擬。如果設定為字串,該賬號必須授予源賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須向直接前置的身份授予 Service Account Token Creator IAM 角色,其中列表中的第一個賬號將此角色授予源賬號(模板化)。
- class airflow.providers.google.cloud.operators.dataplex.DataplexCreateLakeOperator(project_id, region, lake_id, body, validate_only=None, api_version='v1', retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, asynchronous=False, *args, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator在 lake 中建立一個 lake 資源。
- 引數:
project_id (str) – 必需。Lake 所屬的 Google Cloud 專案 ID。
region (str) – 必需。Lake 所屬的 Google Cloud 區域 ID。
lake_id (str) – 必需。Lake 識別符號。
validate_only (bool | None) – 可選。僅驗證請求,但不執行更改。預設為 false。
api_version (str) – 將要請求的 API 版本,例如 ‘v1’。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout (float | None) – 等待請求完成的時間量,以秒為單位。請注意,如果指定了 retry,則超時應用於每次單獨的嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供給方法的附加元資料。
gcp_conn_id (str) – 獲取連線資訊時使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選。用於使用短期憑據進行身份模擬的服務賬號,或獲取列表中最後一個賬號的 access_token 所需的鏈式賬號列表,該賬號將在請求中被模擬。如果設定為字串,該賬號必須授予源賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須向直接前置的身份授予 Service Account Token Creator IAM 角色,其中列表中的第一個賬號將此角色授予源賬號(模板化)。
asynchronous (bool) – 指示 Dataplex lake 是否應非同步建立的標誌。這對於長時間執行的 lake 建立非常有用。
- class airflow.providers.google.cloud.operators.dataplex.DataplexDeleteLakeOperator(project_id, region, lake_id, api_version='v1', retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, *args, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator刪除 lake 資源。
- 引數:
project_id (str) – 必需。Lake 所屬的 Google Cloud 專案 ID。
region (str) – 必需。Lake 所屬的 Google Cloud 區域 ID。
lake_id (str) – 必需。Lake 識別符號。
api_version (str) – 將要請求的 API 版本,例如 ‘v1’。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout (float | None) – 等待請求完成的時間量,以秒為單位。請注意,如果指定了 retry,則超時應用於每次單獨的嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供給方法的附加元資料。
gcp_conn_id (str) – 獲取連線資訊時使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選。用於使用短期憑據進行身份模擬的服務賬號,或獲取列表中最後一個賬號的 access_token 所需的鏈式賬號列表,該賬號將在請求中被模擬。如果設定為字串,該賬號必須授予源賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須向直接前置的身份授予 Service Account Token Creator IAM 角色,其中列表中的第一個賬號將此角色授予源賬號(模板化)。
- class airflow.providers.google.cloud.operators.dataplex.DataplexCreateOrUpdateDataQualityScanOperator(project_id, region, data_scan_id, body, api_version='v1', retry=DEFAULT, timeout=None, update_mask=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, *args, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator建立一個 DataScan 資源。
- 引數:
project_id (str) – 必需。Lake 所屬的 Google Cloud 專案 ID。
region (str) – 必需。Lake 所屬的 Google Cloud 區域 ID。
body (dict[str, Any] | google.cloud.dataplex_v1.types.DataScan) – 必需。請求正文包含 DataScan 的例項。
data_scan_id (str) – 必需。資料質量掃描識別符號。
update_mask (dict | google.protobuf.field_mask_pb2.FieldMask | None) – 要更新的欄位掩碼。
api_version (str) – 將要請求的 API 版本,例如 ‘v1’。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout (float | None) – 等待請求完成的時間量,以秒為單位。請注意,如果指定了 retry,則超時應用於每次單獨的嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供給方法的附加元資料。
gcp_conn_id (str) – 獲取連線資訊時使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選。用於使用短期憑據進行身份模擬的服務賬號,或獲取列表中最後一個賬號的 access_token 所需的鏈式賬號列表,該賬號將在請求中被模擬。如果設定為字串,該賬號必須授予源賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須向直接前置的身份授予 Service Account Token Creator IAM 角色,其中列表中的第一個賬號將此角色授予源賬號(模板化)。
- 返回:
Dataplex 資料掃描 ID
- class airflow.providers.google.cloud.operators.dataplex.DataplexGetDataQualityScanOperator(project_id, region, data_scan_id, api_version='v1', retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, *args, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator獲取 DataScan 資源。
- 引數:
project_id (str) – 必需。Lake 所屬的 Google Cloud 專案 ID。
region (str) – 必需。Lake 所屬的 Google Cloud 區域 ID。
data_scan_id (str) – 必需。資料質量掃描識別符號。
api_version (str) – 將要請求的 API 版本,例如 ‘v1’。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout (float | None) – 等待請求完成的時間量,以秒為單位。請注意,如果指定了 retry,則超時應用於每次單獨的嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供給方法的附加元資料。
gcp_conn_id (str) – 獲取連線資訊時使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選。用於使用短期憑據進行身份模擬的服務賬號,或獲取列表中最後一個賬號的 access_token 所需的鏈式賬號列表,該賬號將在請求中被模擬。如果設定為字串,該賬號必須授予源賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須向直接前置的身份授予 Service Account Token Creator IAM 角色,其中列表中的第一個賬號將此角色授予源賬號(模板化)。
- 返回:
Dataplex 資料掃描
- class airflow.providers.google.cloud.operators.dataplex.DataplexDeleteDataQualityScanOperator(project_id, region, data_scan_id, api_version='v1', retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, *args, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator刪除 DataScan 資源。
- 引數:
project_id (str) – 必需。Lake 所屬的 Google Cloud 專案 ID。
region (str) – 必需。Lake 所屬的 Google Cloud 區域 ID。
data_scan_id (str) – 必需。資料質量掃描識別符號。
api_version (str) – 將要請求的 API 版本,例如 ‘v1’。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout (float | None) – 等待請求完成的時間量,以秒為單位。請注意,如果指定了 retry,則超時應用於每次單獨的嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供給方法的附加元資料。
gcp_conn_id (str) – 獲取連線資訊時使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選。用於使用短期憑據進行身份模擬的服務賬號,或獲取列表中最後一個賬號的 access_token 所需的鏈式賬號列表,該賬號將在請求中被模擬。如果設定為字串,該賬號必須授予源賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須向直接前置的身份授予 Service Account Token Creator IAM 角色,其中列表中的第一個賬號將此角色授予源賬號(模板化)。
- 返回:
無
- class airflow.providers.google.cloud.operators.dataplex.DataplexRunDataQualityScanOperator(project_id, region, data_scan_id, api_version='v1', retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, asynchronous=False, fail_on_dq_failure=False, result_timeout=60.0 * 10, deferrable=conf.getboolean('operators', 'default_deferrable', fallback=False), polling_interval_seconds=10, *args, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator執行 DataScan 的按需執行。
- 引數:
project_id (str) – 必需。Lake 所屬的 Google Cloud 專案 ID。
region (str) – 必需。Lake 所屬的 Google Cloud 區域 ID。
data_scan_id (str) – 必需。資料質量掃描識別符號。
api_version (str) – 將要請求的 API 版本,例如 ‘v1’。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout (float | None) – 等待請求完成的時間量,以秒為單位。請注意,如果指定了 retry,則超時應用於每次單獨的嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供給方法的附加元資料。
gcp_conn_id (str) – 獲取連線資訊時使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選。用於使用短期憑據進行身份模擬的服務賬號,或獲取列表中最後一個賬號的 access_token 所需的鏈式賬號列表,該賬號將在請求中被模擬。如果設定為字串,該賬號必須授予源賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須向直接前置的身份授予 Service Account Token Creator IAM 角色,其中列表中的第一個賬號將此角色授予源賬號(模板化)。
asynchronous (bool) – 指示 Dataplex 作業應以非同步方式執行的標誌。這對於提交長時間執行的作業並使用 DataplexDataQualityJobStatusSensor 非同步等待它們非常有用。
fail_on_dq_failure (bool) – 如果設定為 true 且並非所有資料質量掃描規則都已透過,則會丟擲異常。如果設定為 false 且並非所有資料質量掃描規則都已透過,則執行將成功完成。
result_timeout (float) – 當標誌 asynchronous = False 時,運算子將等待資料質量掃描結果的秒數。如果在指定的秒數後未找到結果,則丟擲異常。
polling_interval_seconds (int) – 輪詢作業完成之間的秒數。該值僅在可推遲模式下執行時考慮。必須大於 0。
deferrable (bool) – 在可推遲模式下執行運算子。
- 返回:
Dataplex 資料質量掃描作業 ID。
- class airflow.providers.google.cloud.operators.dataplex.DataplexGetDataQualityScanResultOperator(project_id, region, data_scan_id, job_id=None, api_version='v1', retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, fail_on_dq_failure=False, wait_for_results=True, result_timeout=60.0 * 10, deferrable=conf.getboolean('operators', 'default_deferrable', fallback=False), polling_interval_seconds=10, *args, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator獲取 Data Scan Job 資源。
- 引數:
project_id (str) – 必需。Lake 所屬的 Google Cloud 專案 ID。
region (str) – 必需。Lake 所屬的 Google Cloud 區域 ID。
data_scan_id (str) – 必需。資料質量掃描識別符號。
job_id (str | None) – 可選。資料質量掃描作業識別符號。
api_version (str) – 將要請求的 API 版本,例如 ‘v1’。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout (float | None) – 等待請求完成的時間量,單位為秒。請注意,如果指定了
retry,則超時應用於每次單獨嘗試。metadata (collections.abc.Sequence[tuple[str, str]]) – 提供給方法的附加元資料。
gcp_conn_id (str) – 獲取連線資訊時使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選。用於使用短期憑據進行身份模擬的服務賬號,或獲取列表中最後一個賬號的 access_token 所需的鏈式賬號列表,該賬號將在請求中被模擬。如果設定為字串,該賬號必須授予源賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須向直接前置的身份授予 Service Account Token Creator IAM 角色,其中列表中的第一個賬號將此角色授予源賬號(模板化)。
fail_on_dq_failure (bool) – 如果設定為 true 且並非所有資料質量掃描規則都已透過,則會丟擲異常。如果設定為 false 且並非所有資料質量掃描規則都已透過,則執行將成功完成。
wait_for_results (bool) – 指示是等待作業執行結果還是返回作業當前狀態的標誌。
result_timeout (float) – 當標誌 wait_for_results = True 時,運算子將等待資料質量掃描結果的秒數。如果在指定的秒數後未找到結果,則丟擲異常。
polling_interval_seconds (int) – 輪詢作業完成之間的秒數。該值僅在可推遲模式下執行時考慮。必須大於 0。
deferrable (bool) – 在可推遲模式下執行運算子。
- 返回:
表示 DataScanJob 的字典。當作業以成功狀態完成時,可以獲取有關資料質量結果的資訊。
- 類 airflow.providers.google.cloud.operators.dataplex.DataplexCreateOrUpdateDataProfileScanOperator(project_id, region, data_scan_id, body, api_version='v1', retry=DEFAULT, timeout=None, update_mask=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, *args, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator建立一個 DataScan Data Profile 資源。
- 引數:
project_id (str) – 必需。Lake 所屬的 Google Cloud 專案 ID。
region (str) – 必需。Lake 所屬的 Google Cloud 區域 ID。
body (dict[str, Any] | google.cloud.dataplex_v1.types.DataScan) – 必需。請求正文包含 DataScan 的例項。
data_scan_id (str) – 必需。資料資料分析掃描識別符號。
update_mask (dict | google.protobuf.field_mask_pb2.FieldMask | None) – 要更新的欄位掩碼。
api_version (str) – 將要請求的 API 版本,例如 ‘v1’。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout (float | None) – 等待請求完成的時間量,以秒為單位。請注意,如果指定了 retry,則超時應用於每次單獨的嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供給方法的附加元資料。
gcp_conn_id (str) – 獲取連線資訊時使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選。用於使用短期憑據進行身份模擬的服務賬號,或獲取列表中最後一個賬號的 access_token 所需的鏈式賬號列表,該賬號將在請求中被模擬。如果設定為字串,該賬號必須授予源賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須向直接前置的身份授予 Service Account Token Creator IAM 角色,其中列表中的第一個賬號將此角色授予源賬號(模板化)。
- 返回:
Dataplex 資料資料分析 ID
- 類 airflow.providers.google.cloud.operators.dataplex.DataplexGetDataProfileScanOperator(project_id, region, data_scan_id, api_version='v1', retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, *args, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator獲取 DataScan DataProfile 資源。
- 引數:
project_id (str) – 必需。Lake 所屬的 Google Cloud 專案 ID。
region (str) – 必需。Lake 所屬的 Google Cloud 區域 ID。
data_scan_id (str) – 必需。資料資料分析掃描識別符號。
api_version (str) – 將要請求的 API 版本,例如 ‘v1’。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout (float | None) – 等待請求完成的時間量,以秒為單位。請注意,如果指定了 retry,則超時應用於每次單獨的嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供給方法的附加元資料。
gcp_conn_id (str) – 獲取連線資訊時使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選。用於使用短期憑據進行身份模擬的服務賬號,或獲取列表中最後一個賬號的 access_token 所需的鏈式賬號列表,該賬號將在請求中被模擬。如果設定為字串,該賬號必須授予源賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須向直接前置的身份授予 Service Account Token Creator IAM 角色,其中列表中的第一個賬號將此角色授予源賬號(模板化)。
- 返回:
Dataplex 資料資料分析
- 類 airflow.providers.google.cloud.operators.dataplex.DataplexDeleteDataProfileScanOperator(project_id, region, data_scan_id, api_version='v1', retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, *args, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator刪除 DataScan DataProfile 資源。
- 引數:
project_id (str) – 必需。Lake 所屬的 Google Cloud 專案 ID。
region (str) – 必需。Lake 所屬的 Google Cloud 區域 ID。
data_scan_id (str) – 必需。資料資料分析掃描識別符號。
api_version (str) – 將要請求的 API 版本,例如 ‘v1’。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout (float | None) – 等待請求完成的時間量,以秒為單位。請注意,如果指定了 retry,則超時應用於每次單獨的嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供給方法的附加元資料。
gcp_conn_id (str) – 獲取連線資訊時使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選。用於使用短期憑據進行身份模擬的服務賬號,或獲取列表中最後一個賬號的 access_token 所需的鏈式賬號列表,該賬號將在請求中被模擬。如果設定為字串,該賬號必須授予源賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須向直接前置的身份授予 Service Account Token Creator IAM 角色,其中列表中的第一個賬號將此角色授予源賬號(模板化)。
- 返回:
無
- 類 airflow.providers.google.cloud.operators.dataplex.DataplexRunDataProfileScanOperator(project_id, region, data_scan_id, api_version='v1', retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, asynchronous=False, result_timeout=60.0 * 10, deferrable=conf.getboolean('operators', 'default_deferrable', fallback=False), polling_interval_seconds=10, *args, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator執行 DataScan Data Profile Scan 的按需執行。
- 引數:
project_id (str) – 必需。Lake 所屬的 Google Cloud 專案 ID。
region (str) – 必需。Lake 所屬的 Google Cloud 區域 ID。
data_scan_id (str) – 必需。資料資料分析掃描識別符號。
api_version (str) – 將要請求的 API 版本,例如 ‘v1’。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout (float | None) – 等待請求完成的時間量,以秒為單位。請注意,如果指定了 retry,則超時應用於每次單獨的嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供給方法的附加元資料。
gcp_conn_id (str) – 獲取連線資訊時使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選。用於使用短期憑據進行身份模擬的服務賬號,或獲取列表中最後一個賬號的 access_token 所需的鏈式賬號列表,該賬號將在請求中被模擬。如果設定為字串,該賬號必須授予源賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須向直接前置的身份授予 Service Account Token Creator IAM 角色,其中列表中的第一個賬號將此角色授予源賬號(模板化)。
asynchronous (bool) – 指示應非同步執行 Dataplex 作業的標誌。這對於提交長時間執行的作業並使用 DataplexDataProfileJobStatusSensor 非同步等待它們的結果非常有用。
result_timeout (float) – 當標誌 asynchronous = False 時,運算子等待資料資料分析掃描結果的秒數。如果在指定的秒數後未找到結果,則丟擲異常。
polling_interval_seconds (int) – 輪詢作業完成之間的秒數。該值僅在可推遲模式下執行時考慮。必須大於 0。
deferrable (bool) – 在可推遲模式下執行運算子。
- 返回:
Dataplex 資料資料分析掃描作業 ID。
- 類 airflow.providers.google.cloud.operators.dataplex.DataplexGetDataProfileScanResultOperator(project_id, region, data_scan_id, job_id=None, api_version='v1', retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, wait_for_results=True, result_timeout=60.0 * 10, *args, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator獲取 DataScan Data Profile Job 資源。
- 引數:
project_id (str) – 必需。Lake 所屬的 Google Cloud 專案 ID。
region (str) – 必需。Lake 所屬的 Google Cloud 區域 ID。
data_scan_id (str) – 必需。資料資料分析掃描識別符號。
job_id (str | None) – 可選。資料資料分析掃描作業識別符號。
api_version (str) – 將要請求的 API 版本,例如 ‘v1’。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout (float | None) – 等待請求完成的時間量,單位為秒。請注意,如果指定了
retry,則超時應用於每次單獨嘗試。metadata (collections.abc.Sequence[tuple[str, str]]) – 提供給方法的附加元資料。
gcp_conn_id (str) – 獲取連線資訊時使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選。用於使用短期憑據進行身份模擬的服務賬號,或獲取列表中最後一個賬號的 access_token 所需的鏈式賬號列表,該賬號將在請求中被模擬。如果設定為字串,該賬號必須授予源賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須向直接前置的身份授予 Service Account Token Creator IAM 角色,其中列表中的第一個賬號將此角色授予源賬號(模板化)。
wait_for_results (bool) – 指示是等待作業執行結果還是返回作業當前狀態的標誌。
result_timeout (浮點數) – 以秒為單位的值,當標誌 wait_for_results = True 時,operator 將等待資料概況掃描結果的時間。如果在指定秒數後未找到結果,則丟擲異常。
- 返回:
表示 DataScanJob 的字典。當作業成功完成時,可獲取資料概況結果的相關資訊。
- class airflow.providers.google.cloud.operators.dataplex.DataplexCreateZoneOperator(project_id, region, lake_id, body, zone_id, api_version='v1', retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, *args, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator在 Lake 中建立一個 Zone 資源。
- 引數:
project_id (str) – 必需。Task 所屬的 Google Cloud 專案的 ID。
region (str) – 必需。Task 所屬的 Google Cloud 區域的 ID。
lake_id (str) – 必需。Task 所屬的 Google Cloud lake 的 ID。
body (字典[字串, Any] | google.cloud.dataplex_v1.types.Zone) – 必需。請求正文包含一個 Zone 例項。
zone_id (字串) – 必需。任務識別符號。
api_version (str) – 將請求的 API 版本,例如 'v3'。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout (float | None) – 等待請求完成的時間量,以秒為單位。請注意,如果指定了 retry,則超時應用於每次單獨的嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供給方法的附加元資料。
gcp_conn_id (str) – 獲取連線資訊時使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選。用於使用短期憑據進行身份模擬的服務賬號,或獲取列表中最後一個賬號的 access_token 所需的鏈式賬號列表,該賬號將在請求中被模擬。如果設定為字串,該賬號必須授予源賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須向直接前置的身份授予 Service Account Token Creator IAM 角色,其中列表中的第一個賬號將此角色授予源賬號(模板化)。
- 返回:
Zone
- class airflow.providers.google.cloud.operators.dataplex.DataplexDeleteZoneOperator(project_id, region, lake_id, zone_id, api_version='v1', retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, *args, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator刪除 Zone 資源。必須先刪除 Zone 內的所有 assets,然後才能刪除 Zone。
- 引數:
project_id (str) – 必需。Task 所屬的 Google Cloud 專案的 ID。
region (str) – 必需。Task 所屬的 Google Cloud 區域的 ID。
lake_id (str) – 必需。Task 所屬的 Google Cloud lake 的 ID。
zone_id (字串) – 必需。Zone 識別符號。
api_version (str) – 將請求的 API 版本,例如 'v3'。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout (float | None) – 等待請求完成的時間量,以秒為單位。請注意,如果指定了 retry,則超時應用於每次單獨的嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供給方法的附加元資料。
gcp_conn_id (str) – 獲取連線資訊時使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選。用於使用短期憑據進行身份模擬的服務賬號,或獲取列表中最後一個賬號的 access_token 所需的鏈式賬號列表,該賬號將在請求中被模擬。如果設定為字串,該賬號必須授予源賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須向直接前置的身份授予 Service Account Token Creator IAM 角色,其中列表中的第一個賬號將此角色授予源賬號(模板化)。
- 返回:
無
- class airflow.providers.google.cloud.operators.dataplex.DataplexCreateAssetOperator(project_id, region, lake_id, body, zone_id, asset_id, api_version='v1', retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, *args, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator建立一個 Asset 資源。
- 引數:
project_id (str) – 必需。Task 所屬的 Google Cloud 專案的 ID。
region (str) – 必需。Task 所屬的 Google Cloud 區域的 ID。
lake_id (字串) – 必需。資產所屬的 Google Cloud Lake 的 ID。
zone_id (字串) – 必需。Zone 識別符號。
asset_id (字串) – 必需。Asset 識別符號。
body (字典[字串, Any] | google.cloud.dataplex_v1.types.Asset) – 必需。請求正文包含一個 Asset 例項。
api_version (str) – 將請求的 API 版本,例如 'v3'。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout (float | None) – 等待請求完成的時間量,以秒為單位。請注意,如果指定了 retry,則超時應用於每次單獨的嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供給方法的附加元資料。
gcp_conn_id (str) – 獲取連線資訊時使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選。用於使用短期憑據進行身份模擬的服務賬號,或獲取列表中最後一個賬號的 access_token 所需的鏈式賬號列表,該賬號將在請求中被模擬。如果設定為字串,該賬號必須授予源賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須向直接前置的身份授予 Service Account Token Creator IAM 角色,其中列表中的第一個賬號將此角色授予源賬號(模板化)。
- 返回:
Asset
- class airflow.providers.google.cloud.operators.dataplex.DataplexDeleteAssetOperator(project_id, region, lake_id, zone_id, asset_id, api_version='v1', retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, *args, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator刪除 asset 資源。
- 引數:
project_id (str) – 必需。Task 所屬的 Google Cloud 專案的 ID。
region (str) – 必需。Task 所屬的 Google Cloud 區域的 ID。
lake_id (字串) – 必需。資產所屬的 Google Cloud Lake 的 ID。
zone_id (字串) – 必需。Zone 識別符號。
asset_id (字串) – 必需。Asset 識別符號。
api_version (str) – 將請求的 API 版本,例如 'v3'。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout (float | None) – 等待請求完成的時間量,以秒為單位。請注意,如果指定了 retry,則超時應用於每次單獨的嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – 提供給方法的附加元資料。
gcp_conn_id (str) – 獲取連線資訊時使用的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – 可選。用於使用短期憑據進行身份模擬的服務賬號,或獲取列表中最後一個賬號的 access_token 所需的鏈式賬號列表,該賬號將在請求中被模擬。如果設定為字串,該賬號必須授予源賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須向直接前置的身份授予 Service Account Token Creator IAM 角色,其中列表中的第一個賬號將此角色授予源賬號(模板化)。
- 返回:
無
- class airflow.providers.google.cloud.operators.dataplex.DataplexCatalogBaseOperator(project_id, location, gcp_conn_id='google_cloud_default', retry=DEFAULT, timeout=None, metadata=(), impersonation_chain=None, *args, **kwargs)[source]¶
Bases:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator所有 Dataplex Catalog 運算子的基類。
- 引數:
project_id (str) – Required. 使用服務的 Google Cloud 專案 ID。
location (str) – Required. 使用服務的 Google Cloud 區域 ID。
gcp_conn_id (str) – Optional. 用於連線到 Google Cloud 的連線 ID。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – Optional. 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout (float | None) – Optional. 等待請求完成的時間(秒)。請注意,如果指定了 retry,則超時時間應用於每次單獨的嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – Optional. 提供給方法的附加元資料。
impersonation_chain (str | collections.abc.Sequence[str] | None) – Optional. 用於使用短期憑據模擬的服務賬號,或者獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該 access_token 將在請求中被模擬。如果設定為字串,則此賬號必須授予發起賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須將 Service Account Token Creator IAM 角色授予其直接前置身份,列表中的第一個賬號將此角色授予發起賬號(模板化)。
- template_fields: collections.abc.Sequence[str] = ('project_id', 'location', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dataplex.DataplexCatalogCreateEntryGroupOperator(entry_group_id, entry_group_configuration, validate_request=False, *args, **kwargs)[source]¶
基礎:
DataplexCatalogBaseOperator建立一個 EntryGroup 資源。
另請參閱
有關如何使用此運算子的更多資訊,請參閱指南: 建立 EntryGroup
- 引數:
entry_group_id (str) – Required. EntryGroup 識別符號。
entry_group_configuration (google.cloud.dataplex_v1.types.EntryGroup | dict) – Required. EntryGroup 配置。更多詳情請參閱 API 文件: https://cloud.google.com/dataplex/docs/reference/rest/v1/projects.locations.entryGroups#EntryGroup
validate_request (bool) – Optional. 如果設定,將執行請求驗證,但不實際執行請求。
project_id – Required. 使用服務的 Google Cloud 專案 ID。
location – Required. 使用服務的 Google Cloud 區域 ID。
gcp_conn_id – Optional. 用於連線到 Google Cloud 的連線 ID。
retry – Optional. 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout – Optional. 等待請求完成的時間(秒)。請注意,如果指定了 retry,則超時時間應用於每次單獨的嘗試。
metadata – Optional. 提供給方法的附加元資料。
impersonation_chain – Optional. 用於使用短期憑據模擬的服務賬號,或者獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該 access_token 將在請求中被模擬。如果設定為字串,則此賬號必須授予發起賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須將 Service Account Token Creator IAM 角色授予其直接前置身份,列表中的第一個賬號將此角色授予發起賬號(模板化)。
- template_fields: collections.abc.Sequence[str][source]¶
- class airflow.providers.google.cloud.operators.dataplex.DataplexCatalogGetEntryGroupOperator(entry_group_id, *args, **kwargs)[source]¶
基礎:
DataplexCatalogBaseOperator獲取 EntryGroup 資源。
另請參閱
有關如何使用此運算子的更多資訊,請參閱指南: 獲取 EntryGroup
- 引數:
entry_group_id (str) – Required. EntryGroup 識別符號。
project_id – Required. 使用服務的 Google Cloud 專案 ID。
location – Required. 使用服務的 Google Cloud 區域 ID。
gcp_conn_id – Optional. 用於連線到 Google Cloud 的連線 ID。
retry – Optional. 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout – Optional. 等待請求完成的時間(秒)。請注意,如果指定了 retry,則超時時間應用於每次單獨的嘗試。
metadata – Optional. 提供給方法的附加元資料。
impersonation_chain – Optional. 用於使用短期憑據模擬的服務賬號,或者獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該 access_token 將在請求中被模擬。如果設定為字串,則此賬號必須授予發起賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須將 Service Account Token Creator IAM 角色授予其直接前置身份,列表中的第一個賬號將此角色授予發起賬號(模板化)。
- template_fields: collections.abc.Sequence[str][source]¶
- class airflow.providers.google.cloud.operators.dataplex.DataplexCatalogDeleteEntryGroupOperator(entry_group_id, *args, **kwargs)[source]¶
基礎:
DataplexCatalogBaseOperator刪除 EntryGroup 資源。
另請參閱
有關如何使用此運算子的更多資訊,請參閱指南: 刪除 EntryGroup
- 引數:
entry_group_id (str) – Required. EntryGroup 識別符號。
project_id – Required. 使用服務的 Google Cloud 專案 ID。
location – Required. 使用服務的 Google Cloud 區域 ID。
gcp_conn_id – Optional. 用於連線到 Google Cloud 的連線 ID。
retry – Optional. 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout – Optional. 等待請求完成的時間(秒)。請注意,如果指定了 retry,則超時時間應用於每次單獨的嘗試。
metadata – Optional. 提供給方法的附加元資料。
impersonation_chain – Optional. 用於使用短期憑據模擬的服務賬號,或者獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該 access_token 將在請求中被模擬。如果設定為字串,則此賬號必須授予發起賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須將 Service Account Token Creator IAM 角色授予其直接前置身份,列表中的第一個賬號將此角色授予發起賬號(模板化)。
- template_fields: collections.abc.Sequence[str][source]¶
- class airflow.providers.google.cloud.operators.dataplex.DataplexCatalogListEntryGroupsOperator(page_size=None, page_token=None, filter_by=None, order_by=None, *args, **kwargs)[source]¶
基礎:
DataplexCatalogBaseOperator列出 EntryGroup 資源。
另請參閱
有關如何使用此運算子的更多資訊,請參閱指南: 列出 EntryGroups
- 引數:
filter_by (str | None) – Optional. 應用於列表結果的過濾器。
order_by (str | None) – Optional. 用於對結果進行排序的欄位。
page_size (int | None) – Optional. 每頁返回的 EntryGroups 最大數量。
page_token (str | None) – Optional. 用於檢索下一頁結果的令牌。
project_id – Required. 使用服務的 Google Cloud 專案 ID。
location – Required. 使用服務的 Google Cloud 區域 ID。
gcp_conn_id – Optional. 用於連線到 Google Cloud 的連線 ID。
retry – Optional. 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout – Optional. 等待請求完成的時間(秒)。請注意,如果指定了 retry,則超時時間應用於每次單獨的嘗試。
metadata – Optional. 提供給方法的附加元資料。
impersonation_chain – Optional. 用於使用短期憑據模擬的服務賬號,或者獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該 access_token 將在請求中被模擬。如果設定為字串,則此賬號必須授予發起賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須將 Service Account Token Creator IAM 角色授予其直接前置身份,列表中的第一個賬號將此角色授予發起賬號(模板化)。
- template_fields: collections.abc.Sequence[str] = ('project_id', 'location', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dataplex.DataplexCatalogUpdateEntryGroupOperator(entry_group_id, entry_group_configuration, update_mask=None, validate_request=False, *args, **kwargs)[source]¶
基礎:
DataplexCatalogBaseOperator更新 EntryGroup 資源。
另請參閱
有關如何使用此運算子的更多資訊,請參閱指南: 更新 EntryGroup
- 引數:
project_id – Required. 任務所屬的 Google Cloud 專案 ID。
location – Required. 任務所屬的 Google Cloud 區域 ID。
update_mask (list[str] | google.protobuf.field_mask_pb2.FieldMask | None) – Optional. 要覆蓋條目組上其值的欄位名稱。如果此引數缺失或為空,則會覆蓋所有可修改欄位。如果請求正文中省略了此類非必需欄位,則其值將被清空。
entry_group_id (str) – Required. 要更新的 EntryGroup ID。
entry_group_configuration (dict | google.cloud.dataplex_v1.types.EntryGroup) – Required. EntryGroup 的更新配置正文。更多詳情請參閱 API 文件: https://cloud.google.com/dataplex/docs/reference/rest/v1/projects.locations.entryGroups#EntryGroup
validate_only – Optional. 服務驗證請求,但不執行任何修改。
retry – Optional. 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout – Optional. 等待請求完成的時間(秒)。請注意,如果指定了 retry,則超時時間應用於每次單獨的嘗試。
metadata – Optional. 提供給方法的附加元資料。
gcp_conn_id – Optional. 獲取連線資訊時使用的連線 ID。
impersonation_chain – Optional. 用於使用短期憑據模擬的服務賬號,或者獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該 access_token 將在請求中被模擬。如果設定為字串,則此賬號必須授予發起賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須將 Service Account Token Creator IAM 角色授予其直接前置身份,列表中的第一個賬號將此角色授予發起賬號(模板化)。
- template_fields: collections.abc.Sequence[str][source]¶
- class airflow.providers.google.cloud.operators.dataplex.DataplexCatalogCreateEntryTypeOperator(entry_type_id, entry_type_configuration, validate_request=False, *args, **kwargs)[source]¶
基礎:
DataplexCatalogBaseOperator建立一個 EntryType 資源。
另請參閱
有關如何使用此運算子的更多資訊,請參閱指南: 建立 EntryType
- 引數:
entry_type_id (str) – Required. EntryType 識別符號。
entry_type_configuration (google.cloud.dataplex_v1.types.EntryType | dict) – 必需。EntryType 配置。有關更多詳細資訊,請參閱 API 文件:https://cloud.google.com/dataplex/docs/reference/rest/v1/projects.locations.entryGroups#EntryGroup
validate_request (bool) – Optional. 如果設定,將執行請求驗證,但不實際執行請求。
project_id – Required. 使用服務的 Google Cloud 專案 ID。
location – Required. 使用服務的 Google Cloud 區域 ID。
gcp_conn_id – Optional. 用於連線到 Google Cloud 的連線 ID。
retry – Optional. 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout – Optional. 等待請求完成的時間(秒)。請注意,如果指定了 retry,則超時時間應用於每次單獨的嘗試。
metadata – Optional. 提供給方法的附加元資料。
impersonation_chain – Optional. 用於使用短期憑據模擬的服務賬號,或者獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該 access_token 將在請求中被模擬。如果設定為字串,則此賬號必須授予發起賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須將 Service Account Token Creator IAM 角色授予其直接前置身份,列表中的第一個賬號將此角色授予發起賬號(模板化)。
- template_fields: collections.abc.Sequence[str][source]¶
- class airflow.providers.google.cloud.operators.dataplex.DataplexCatalogGetEntryTypeOperator(entry_type_id, *args, **kwargs)[source]¶
基礎:
DataplexCatalogBaseOperator獲取 EntryType 資源。
另請參閱
有關如何使用此運算子的更多資訊,請參閱指南:獲取 EntryType
- 引數:
entry_type_id (str) – Required. EntryType 識別符號。
project_id – Required. 使用服務的 Google Cloud 專案 ID。
location – Required. 使用服務的 Google Cloud 區域 ID。
gcp_conn_id – Optional. 用於連線到 Google Cloud 的連線 ID。
retry – Optional. 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout – Optional. 等待請求完成的時間(秒)。請注意,如果指定了 retry,則超時時間應用於每次單獨的嘗試。
metadata – Optional. 提供給方法的附加元資料。
impersonation_chain – Optional. 用於使用短期憑據模擬的服務賬號,或者獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該 access_token 將在請求中被模擬。如果設定為字串,則此賬號必須授予發起賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須將 Service Account Token Creator IAM 角色授予其直接前置身份,列表中的第一個賬號將此角色授予發起賬號(模板化)。
- template_fields: collections.abc.Sequence[str][source]¶
- class airflow.providers.google.cloud.operators.dataplex.DataplexCatalogDeleteEntryTypeOperator(entry_type_id, *args, **kwargs)[source]¶
基礎:
DataplexCatalogBaseOperator刪除 EntryType 資源。
另請參閱
有關如何使用此運算子的更多資訊,請參閱指南:刪除 EntryType
- 引數:
entry_type_id (str) – Required. EntryType 識別符號。
project_id – Required. 使用服務的 Google Cloud 專案 ID。
location – Required. 使用服務的 Google Cloud 區域 ID。
gcp_conn_id – Optional. 用於連線到 Google Cloud 的連線 ID。
retry – Optional. 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout – Optional. 等待請求完成的時間(秒)。請注意,如果指定了 retry,則超時時間應用於每次單獨的嘗試。
metadata – Optional. 提供給方法的附加元資料。
impersonation_chain – Optional. 用於使用短期憑據模擬的服務賬號,或者獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該 access_token 將在請求中被模擬。如果設定為字串,則此賬號必須授予發起賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須將 Service Account Token Creator IAM 角色授予其直接前置身份,列表中的第一個賬號將此角色授予發起賬號(模板化)。
- template_fields: collections.abc.Sequence[str][source]¶
- class airflow.providers.google.cloud.operators.dataplex.DataplexCatalogListEntryTypesOperator(page_size=None, page_token=None, filter_by=None, order_by=None, *args, **kwargs)[source]¶
基礎:
DataplexCatalogBaseOperator列出 EntryType 資源。
另請參閱
有關如何使用此運算子的更多資訊,請參閱指南:列出 EntryType
- 引數:
filter_by (str | None) – Optional. 應用於列表結果的過濾器。
order_by (str | None) – Optional. 用於對結果進行排序的欄位。
page_size (int | None) – 可選。每頁返回的最大 EntryType 數量。
page_token (str | None) – Optional. 用於檢索下一頁結果的令牌。
project_id – Required. 使用服務的 Google Cloud 專案 ID。
location – Required. 使用服務的 Google Cloud 區域 ID。
gcp_conn_id – Optional. 用於連線到 Google Cloud 的連線 ID。
retry – Optional. 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout – Optional. 等待請求完成的時間(秒)。請注意,如果指定了 retry,則超時時間應用於每次單獨的嘗試。
metadata – Optional. 提供給方法的附加元資料。
impersonation_chain – Optional. 用於使用短期憑據模擬的服務賬號,或者獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該 access_token 將在請求中被模擬。如果設定為字串,則此賬號必須授予發起賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須將 Service Account Token Creator IAM 角色授予其直接前置身份,列表中的第一個賬號將此角色授予發起賬號(模板化)。
- template_fields: collections.abc.Sequence[str] = ('project_id', 'location', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dataplex.DataplexCatalogUpdateEntryTypeOperator(entry_type_id, entry_type_configuration, update_mask=None, validate_request=False, *args, **kwargs)[source]¶
基礎:
DataplexCatalogBaseOperator更新 EntryType 資源。
另請參閱
有關如何使用此運算子的更多資訊,請參閱指南:更新 EntryType
- 引數:
project_id – Required. 任務所屬的 Google Cloud 專案 ID。
location – Required. 任務所屬的 Google Cloud 區域 ID。
update_mask (list[str] | google.protobuf.field_mask_pb2.FieldMask | None) – Optional. 要覆蓋條目組上其值的欄位名稱。如果此引數缺失或為空,則會覆蓋所有可修改欄位。如果請求正文中省略了此類非必需欄位,則其值將被清空。
entry_type_id (str) – 必需。要更新的 EntryType 的 ID。
entry_type_configuration (dict | google.cloud.dataplex_v1.types.EntryType) – 必需。EntryType 更新後的配置主體。有關更多詳細資訊,請參閱 API 文件:https://cloud.google.com/dataplex/docs/reference/rest/v1/projects.locations.entryGroups#EntryGroup
validate_only – Optional. 服務驗證請求,但不執行任何修改。
retry – Optional. 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout – Optional. 等待請求完成的時間(秒)。請注意,如果指定了 retry,則超時時間應用於每次單獨的嘗試。
metadata – Optional. 提供給方法的附加元資料。
gcp_conn_id – Optional. 獲取連線資訊時使用的連線 ID。
impersonation_chain – Optional. 用於使用短期憑據模擬的服務賬號,或者獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該 access_token 將在請求中被模擬。如果設定為字串,則此賬號必須授予發起賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須將 Service Account Token Creator IAM 角色授予其直接前置身份,列表中的第一個賬號將此角色授予發起賬號(模板化)。
- template_fields: collections.abc.Sequence[str][source]¶
- class airflow.providers.google.cloud.operators.dataplex.DataplexCatalogCreateAspectTypeOperator(aspect_type_id, aspect_type_configuration, validate_request=False, *args, **kwargs)[source]¶
基礎:
DataplexCatalogBaseOperator建立一個 AspectType 資源。
另請參閱
有關如何使用此運算子的更多資訊,請參閱指南:建立 AspectType
- 引數:
aspect_type_id (str) – 必需。AspectType 識別符號。
aspect_type_configuration (google.cloud.dataplex_v1.types.AspectType | dict) – 必需。AspectType 配置。有關更多詳細資訊,請參閱 API 文件:https://cloud.google.com/dataplex/docs/reference/rest/v1/projects.locations.aspectTypes#AspectType
validate_request (bool) – Optional. 如果設定,將執行請求驗證,但不實際執行請求。
project_id – Required. 使用服務的 Google Cloud 專案 ID。
location – Required. 使用服務的 Google Cloud 區域 ID。
gcp_conn_id – Optional. 用於連線到 Google Cloud 的連線 ID。
retry – Optional. 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout – Optional. 等待請求完成的時間(秒)。請注意,如果指定了 retry,則超時時間應用於每次單獨的嘗試。
metadata – Optional. 提供給方法的附加元資料。
impersonation_chain – Optional. 用於使用短期憑據模擬的服務賬號,或者獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該 access_token 將在請求中被模擬。如果設定為字串,則此賬號必須授予發起賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須將 Service Account Token Creator IAM 角色授予其直接前置身份,列表中的第一個賬號將此角色授予發起賬號(模板化)。
- template_fields: collections.abc.Sequence[str][source]¶
- class airflow.providers.google.cloud.operators.dataplex.DataplexCatalogGetAspectTypeOperator(aspect_type_id, *args, **kwargs)[source]¶
基礎:
DataplexCatalogBaseOperator獲取 AspectType 資源。
另請參閱
有關如何使用此運算子的更多資訊,請參閱指南:獲取 AspectType
- 引數:
aspect_type_id (str) – 必需。AspectType 識別符號。
project_id – Required. 使用服務的 Google Cloud 專案 ID。
location – Required. 使用服務的 Google Cloud 區域 ID。
gcp_conn_id – Optional. 用於連線到 Google Cloud 的連線 ID。
retry – Optional. 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout – Optional. 等待請求完成的時間(秒)。請注意,如果指定了 retry,則超時時間應用於每次單獨的嘗試。
metadata – Optional. 提供給方法的附加元資料。
impersonation_chain – Optional. 用於使用短期憑據模擬的服務賬號,或者獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該 access_token 將在請求中被模擬。如果設定為字串,則此賬號必須授予發起賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須將 Service Account Token Creator IAM 角色授予其直接前置身份,列表中的第一個賬號將此角色授予發起賬號(模板化)。
- template_fields: collections.abc.Sequence[str][source]¶
- class airflow.providers.google.cloud.operators.dataplex.DataplexCatalogListAspectTypesOperator(page_size=None, page_token=None, filter_by=None, order_by=None, *args, **kwargs)[source]¶
基礎:
DataplexCatalogBaseOperator列出 AspectType 資源。
另請參閱
有關如何使用此運算子的更多資訊,請參閱指南:列出 AspectType
- 引數:
filter_by (str | None) – Optional. 應用於列表結果的過濾器。
order_by (str | None) – Optional. 用於對結果進行排序的欄位。
page_size (int | None) – 可選。每頁返回的最大 AspectType 數量。
page_token (str | None) – Optional. 用於檢索下一頁結果的令牌。
project_id – Required. 使用服務的 Google Cloud 專案 ID。
location – Required. 使用服務的 Google Cloud 區域 ID。
gcp_conn_id – Optional. 用於連線到 Google Cloud 的連線 ID。
retry – Optional. 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout – Optional. 等待請求完成的時間(秒)。請注意,如果指定了 retry,則超時時間應用於每次單獨的嘗試。
metadata – Optional. 提供給方法的附加元資料。
impersonation_chain – Optional. 用於使用短期憑據模擬的服務賬號,或者獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該 access_token 將在請求中被模擬。如果設定為字串,則此賬號必須授予發起賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須將 Service Account Token Creator IAM 角色授予其直接前置身份,列表中的第一個賬號將此角色授予發起賬號(模板化)。
- template_fields: collections.abc.Sequence[str] = ('project_id', 'location', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dataplex.DataplexCatalogUpdateAspectTypeOperator(aspect_type_id, aspect_type_configuration, update_mask=None, validate_request=False, *args, **kwargs)[source]¶
基礎:
DataplexCatalogBaseOperator更新 AspectType 資源。
另請參閱
有關如何使用此運算子的更多資訊,請參閱指南:更新 AspectType
- 引數:
project_id – Required. 任務所屬的 Google Cloud 專案 ID。
location – Required. 任務所屬的 Google Cloud 區域 ID。
update_mask (list[str] | google.protobuf.field_mask_pb2.FieldMask | None) – Optional. 要覆蓋條目組上其值的欄位名稱。如果此引數缺失或為空,則會覆蓋所有可修改欄位。如果請求正文中省略了此類非必需欄位,則其值將被清空。
aspect_type_id (str) – 必需。要更新的 AspectType 的 ID。
aspect_type_configuration (dict (字典) | google.cloud.dataplex_v1.types.AspectType) – 必需。AspectType 更新後的配置主體。有關更多詳情,請參閱 API 文件:https://cloud.google.com/dataplex/docs/reference/rest/v1/projects.locations.aspectTypes#AspectType
validate_only – Optional. 服務驗證請求,但不執行任何修改。
retry – Optional. 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout – Optional. 等待請求完成的時間(秒)。請注意,如果指定了 retry,則超時時間應用於每次單獨的嘗試。
metadata – Optional. 提供給方法的附加元資料。
gcp_conn_id – Optional. 獲取連線資訊時使用的連線 ID。
impersonation_chain – Optional. 用於使用短期憑據模擬的服務賬號,或者獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該 access_token 將在請求中被模擬。如果設定為字串,則此賬號必須授予發起賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須將 Service Account Token Creator IAM 角色授予其直接前置身份,列表中的第一個賬號將此角色授予發起賬號(模板化)。
- template_fields: collections.abc.Sequence[str][source]¶
- class airflow.providers.google.cloud.operators.dataplex.DataplexCatalogDeleteAspectTypeOperator(aspect_type_id, *args, **kwargs)[source]¶
基礎:
DataplexCatalogBaseOperator刪除 AspectType 資源。
另請參閱
要詳細瞭解如何使用此運算子,請參閱以下指南:Delete an AspectType
- 引數:
aspect_type_id (str) – 必需。AspectType 識別符號。
project_id – Required. 使用服務的 Google Cloud 專案 ID。
location – Required. 使用服務的 Google Cloud 區域 ID。
gcp_conn_id – Optional. 用於連線到 Google Cloud 的連線 ID。
retry – Optional. 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout – Optional. 等待請求完成的時間(秒)。請注意,如果指定了 retry,則超時時間應用於每次單獨的嘗試。
metadata – Optional. 提供給方法的附加元資料。
impersonation_chain – Optional. 用於使用短期憑據模擬的服務賬號,或者獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該 access_token 將在請求中被模擬。如果設定為字串,則此賬號必須授予發起賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須將 Service Account Token Creator IAM 角色授予其直接前置身份,列表中的第一個賬號將此角色授予發起賬號(模板化)。
- template_fields: collections.abc.Sequence[str][source]¶
- class airflow.providers.google.cloud.operators.dataplex.DataplexCatalogCreateEntryOperator(entry_id, entry_group_id, entry_configuration, *args, **kwargs)[source]¶
基礎:
DataplexCatalogBaseOperator建立一個 Entry 資源。
另請參閱
要詳細瞭解如何使用此運算子,請參閱以下指南:Create an Entry
- 引數:
entry_id (str (字串)) – 必需。條目識別符號。它必須在條目組內唯一。與 Google Cloud 資源對應的條目使用基於完整資源名稱的條目 ID 格式。格式為資源名稱,但省略了完整資源名稱中 API 服務名稱部分的雙斜槓字首。這允許使用與條目關聯的資源名稱檢索條目。例如,如果某個資源的完整資源名稱是
//library.googleapis.com/shelves/shelf1/books/book2,則建議的 entry_id 為library.googleapis.com/shelves/shelf1/books/book2。也建議對於與 Google Cloud 以外的提供商或系統的資源對應的條目,遵循相同的約定。欄位的最大大小為 4000 個字元。entry_group_id (str (字串)) – 必需。該建立的條目將屬於的 EntryGroup 資源名稱。
entry_configuration (google.cloud.dataplex_v1.types.Entry | dict (字典)) – 必需。條目配置。有關更多詳情,請參閱 API 文件:https://cloud.google.com/dataplex/docs/reference/rest/v1/projects.locations.entryGroups.entries#Entry
project_id – Required. 使用服務的 Google Cloud 專案 ID。
location – Required. 使用服務的 Google Cloud 區域 ID。
gcp_conn_id – Optional. 用於連線到 Google Cloud 的連線 ID。
retry – Optional. 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout – Optional. 等待請求完成的時間(秒)。請注意,如果指定了 retry,則超時時間應用於每次單獨的嘗試。
metadata – Optional. 提供給方法的附加元資料。
impersonation_chain – Optional. 用於使用短期憑據模擬的服務賬號,或者獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該 access_token 將在請求中被模擬。如果設定為字串,則此賬號必須授予發起賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須將 Service Account Token Creator IAM 角色授予其直接前置身份,列表中的第一個賬號將此角色授予發起賬號(模板化)。
- template_fields: collections.abc.Sequence[str][source]¶
- class airflow.providers.google.cloud.operators.dataplex.DataplexCatalogGetEntryOperator(entry_id, entry_group_id, view=None, aspect_types=None, paths=None, *args, **kwargs)[source]¶
基礎:
DataplexCatalogBaseOperator獲取 Entry 資源。
另請參閱
要詳細瞭解如何使用此運算子,請參閱以下指南:Get an Entry
- 引數:
entry_id (str (字串)) – 必需。條目識別符號。它必須在條目組內唯一。與 Google Cloud 資源對應的條目使用基於完整資源名稱的條目 ID 格式。格式為資源名稱,但省略了完整資源名稱中 API 服務名稱部分的雙斜槓字首。這允許使用與條目關聯的資源名稱檢索條目。例如,如果某個資源的完整資源名稱是
//library.googleapis.com/shelves/shelf1/books/book2,則建議的 entry_id 為library.googleapis.com/shelves/shelf1/books/book2。也建議對於與 Google Cloud 以外的提供商或系統的資源對應的條目,遵循相同的約定。欄位的最大大小為 4000 個字元。entry_group_id (str (字串)) – 必需。該建立的條目將屬於的 EntryGroup 資源名稱。
project_id – Required. 使用服務的 Google Cloud 專案 ID。
location – Required. 使用服務的 Google Cloud 區域 ID。
view (google.cloud.dataplex_v1.types.EntryView | str (字串) | None) – 可選。用於控制服務應返回的條目的哪些部分的檢視。
aspect_types (collections.abc.MutableSequence[str (字串)] | None) – 可選。將返回的方面限制為提供的 AspectType。它僅適用於 CUSTOM 檢視。
paths (collections.abc.MutableSequence[str (字串)] | None) – 可選。將返回的方面限制為與條目內提供的路徑相關聯的那些。它僅適用於 CUSTOM 檢視。
gcp_conn_id – Optional. 用於連線到 Google Cloud 的連線 ID。
retry – Optional. 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout – Optional. 等待請求完成的時間(秒)。請注意,如果指定了 retry,則超時時間應用於每次單獨的嘗試。
metadata – Optional. 提供給方法的附加元資料。
impersonation_chain – Optional. 用於使用短期憑據模擬的服務賬號,或者獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該 access_token 將在請求中被模擬。如果設定為字串,則此賬號必須授予發起賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須將 Service Account Token Creator IAM 角色授予其直接前置身份,列表中的第一個賬號將此角色授予發起賬號(模板化)。
- template_fields: collections.abc.Sequence[str][source]¶
- class airflow.providers.google.cloud.operators.dataplex.DataplexCatalogListEntriesOperator(entry_group_id, page_size=None, page_token=None, filter_by=None, *args, **kwargs)[source]¶
基礎:
DataplexCatalogBaseOperator列出 Entry 資源。
另請參閱
要詳細瞭解如何使用此運算子,請參閱以下指南:List Entries
- 引數:
entry_group_id (str (字串)) – 必需。該建立的條目所屬的 EntryGroup 資源名稱。
filter_by (str (字串) | None) –
可選。用於過濾要返回的條目的過濾器。過濾器區分大小寫。您可以透過以下欄位過濾請求:
entry_type
entry_source.display_name
比較運算子包括 =、!=、<、>、<=、>=。服務根據詞彙順序比較字串。您可以在過濾器中使用邏輯運算子 AND、OR、NOT。您可以使用萬用字元“*”,但對於 entry_type,您需要提供完整的專案 ID 或編號。示例過濾器表示式:
”entry_source.display_name=AnExampleDisplayName”
”entry_type=projects/example-project/locations/global/entryTypes/example-entry_type”
- ”entry_type=projects/example-project/locations/us/entryTypes/a*
OR entry_type=projects/another-project/locations/*”
”NOT entry_source.display_name=AnotherExampleDisplayName”。
page_size (int (整數) | None) – 可選。每頁返回的條目數。如果還有剩餘結果,服務會返回 next_page_token。如果未指定,服務最多返回 10 個條目。最大值為 100;大於 100 的值將被強制設為 100。
page_token (str (字串) | None) – 可選。從上一個
ListEntries呼叫接收到的頁面令牌。提供此令牌以檢索後續頁面。project_id – Required. 使用服務的 Google Cloud 專案 ID。
location – Required. 使用服務的 Google Cloud 區域 ID。
gcp_conn_id – Optional. 用於連線到 Google Cloud 的連線 ID。
retry – Optional. 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout – Optional. 等待請求完成的時間(秒)。請注意,如果指定了 retry,則超時時間應用於每次單獨的嘗試。
metadata – Optional. 提供給方法的附加元資料。
impersonation_chain – Optional. 用於使用短期憑據模擬的服務賬號,或者獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該 access_token 將在請求中被模擬。如果設定為字串,則此賬號必須授予發起賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須將 Service Account Token Creator IAM 角色授予其直接前置身份,列表中的第一個賬號將此角色授予發起賬號(模板化)。
- template_fields: collections.abc.Sequence[str] = ('project_id', 'location', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dataplex.DataplexCatalogSearchEntriesOperator(query, order_by=None, scope=None, page_size=None, page_token=None, *args, **kwargs)[source]¶
基礎:
DataplexCatalogBaseOperator根據指定的查詢和範圍搜尋 Entries。
另請參閱
要詳細瞭解如何使用此運算子,請參閱以下指南:Search Entries
- 引數:
query (str (字串)) – 必需。要在範圍內匹配條目的查詢。查詢語法在 Dataplex Catalog 的搜尋語法 中定義。
order_by (str (字串) | None) –
可選。指定結果的排序方式。支援的值包括:
relevance(預設)last_modified_timestamplast_modified_timestamp asc
scope (str (字串) | None) – 可選。搜尋應在其下進行操作的範圍。它必須是
organizations/<org_id>或projects/<project_ref>之一。如果未指定,則預設為name中提供的專案所在的組織。page_size (int (整數) | None) – 可選。每頁返回的條目數。如果還有剩餘結果,服務會返回 next_page_token。如果未指定,服務最多返回 10 個條目。最大值為 100;大於 100 的值將被強制設為 100。
page_token (str (字串) | None) – 可選。從上一個
ListEntries呼叫接收到的頁面令牌。提供此令牌以檢索後續頁面。project_id – Required. 使用服務的 Google Cloud 專案 ID。
location – Required. 使用服務的 Google Cloud 區域 ID。
gcp_conn_id – Optional. 用於連線到 Google Cloud 的連線 ID。
retry – Optional. 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout – Optional. 等待請求完成的時間(秒)。請注意,如果指定了 retry,則超時時間應用於每次單獨的嘗試。
metadata – Optional. 提供給方法的附加元資料。
impersonation_chain – Optional. 用於使用短期憑據模擬的服務賬號,或者獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該 access_token 將在請求中被模擬。如果設定為字串,則此賬號必須授予發起賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須將 Service Account Token Creator IAM 角色授予其直接前置身份,列表中的第一個賬號將此角色授予發起賬號(模板化)。
- template_fields: collections.abc.Sequence[str][source]¶
- class airflow.providers.google.cloud.operators.dataplex.DataplexCatalogLookupEntryOperator(entry_id, entry_group_id, view=None, aspect_types=None, paths=None, *args, **kwargs)[source]¶
基礎:
DataplexCatalogBaseOperator使用源系統上的許可權按名稱查詢單個 Entry。
另請參閱
要詳細瞭解如何使用此運算子,請參閱以下指南:Look up a single Entry
- 引數:
entry_id (str (字串)) – 必需。條目識別符號。它必須在條目組內唯一。與 Google Cloud 資源對應的條目使用基於完整資源名稱的條目 ID 格式。格式為資源名稱,但省略了完整資源名稱中 API 服務名稱部分的雙斜槓字首。這允許使用與條目關聯的資源名稱檢索條目。例如,如果某個資源的完整資源名稱是
//library.googleapis.com/shelves/shelf1/books/book2,則建議的 entry_id 為library.googleapis.com/shelves/shelf1/books/book2。也建議對於與 Google Cloud 以外的提供商或系統的資源對應的條目,遵循相同的約定。欄位的最大大小為 4000 個字元。entry_group_id (str (字串)) – 必需。該建立的條目將屬於的 EntryGroup 資源名稱。
project_id – Required. 使用服務的 Google Cloud 專案 ID。
location – Required. 使用服務的 Google Cloud 區域 ID。
view (google.cloud.dataplex_v1.types.EntryView | str (字串) | None) – 可選。用於控制服務應返回的條目的哪些部分的檢視。
aspect_types (collections.abc.MutableSequence[str (字串)] | None) – 可選。將返回的方面限制為提供的 AspectType。它僅適用於 CUSTOM 檢視。
paths (collections.abc.MutableSequence[str (字串)] | None) – 可選。將返回的方面限制為與條目內提供的路徑相關聯的那些。它僅適用於 CUSTOM 檢視。
gcp_conn_id – Optional. 用於連線到 Google Cloud 的連線 ID。
retry – Optional. 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout – Optional. 等待請求完成的時間(秒)。請注意,如果指定了 retry,則超時時間應用於每次單獨的嘗試。
metadata – Optional. 提供給方法的附加元資料。
impersonation_chain – Optional. 用於使用短期憑據模擬的服務賬號,或者獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該 access_token 將在請求中被模擬。如果設定為字串,則此賬號必須授予發起賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須將 Service Account Token Creator IAM 角色授予其直接前置身份,列表中的第一個賬號將此角色授予發起賬號(模板化)。
- template_fields: collections.abc.Sequence[str][source]¶
- 類 airflow.providers.google.cloud.operators.dataplex.DataplexCatalogUpdateEntryOperator(entry_id, entry_group_id, entry_configuration, allow_missing=False, delete_missing_aspects=False, aspect_keys=None, update_mask=None, *args, **kwargs)[原始碼]¶
基礎:
DataplexCatalogBaseOperator更新 Entry 資源。
另請參閱
有關如何使用此運算子的更多資訊,請參閱指南:更新條目
- 引數:
project_id – Required. 任務所屬的 Google Cloud 專案 ID。
location – Required. 任務所屬的 Google Cloud 區域 ID。
entry_id (str (字串)) – 必需。條目識別符號。它必須在條目組內唯一。與 Google Cloud 資源對應的條目使用基於完整資源名稱的條目 ID 格式。格式為資源名稱,但省略了完整資源名稱中 API 服務名稱部分的雙斜槓字首。這允許使用與條目關聯的資源名稱檢索條目。例如,如果某個資源的完整資源名稱是
//library.googleapis.com/shelves/shelf1/books/book2,則建議的 entry_id 為library.googleapis.com/shelves/shelf1/books/book2。也建議對於與 Google Cloud 以外的提供商或系統的資源對應的條目,遵循相同的約定。欄位的最大大小為 4000 個字元。entry_group_id (str (字串)) – 必需。該建立的條目所屬的 EntryGroup 資源名稱。
entry_configuration (dict | google.cloud.dataplex_v1.types.Entry) – 必填。條目的更新配置主體。
allow_missing (bool | None) – 可選。如果設定為 true 且條目不存在,服務將建立它。
delete_missing_aspects (bool | None) – 可選。如果設定為 true 且 aspect_keys 指定了 Aspect 範圍,服務將刪除該範圍內請求中未提供的任何現有 Aspect。
aspect_keys (collections.abc.MutableSequence[str] | None) –
可選。服務應修改的 Aspect 的對映鍵。它支援以下語法:
<aspect_type_reference>- 匹配給定型別和空路徑的 Aspect。<aspect_type_reference>@path- 匹配給定型別和指定路徑的 Aspect。例如,要將 Aspect 附加到由
schemaAspect 指定的欄位,路徑應採用以下格式:Schema.<field_name>。
<aspect_type_reference>@*- 匹配給定型別在所有路徑上的 Aspect。*@path- 匹配給定路徑上所有型別的 Aspect。
除非將
delete_missing_aspects設定為 true,否則服務不會刪除與該語法匹配的現有 Aspect。如果此欄位留空,服務會將其視為僅指定請求中存在的那些 Aspect。retry – Optional. 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout – Optional. 等待請求完成的時間(秒)。請注意,如果指定了 retry,則超時時間應用於每次單獨的嘗試。
metadata – Optional. 提供給方法的附加元資料。
gcp_conn_id – Optional. 獲取連線資訊時使用的連線 ID。
impersonation_chain – Optional. 用於使用短期憑據模擬的服務賬號,或者獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該 access_token 將在請求中被模擬。如果設定為字串,則此賬號必須授予發起賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須將 Service Account Token Creator IAM 角色授予其直接前置身份,列表中的第一個賬號將此角色授予發起賬號(模板化)。
- template_fields: collections.abc.Sequence[str][原始碼]¶
- 類 airflow.providers.google.cloud.operators.dataplex.DataplexCatalogDeleteEntryOperator(entry_id, entry_group_id, *args, **kwargs)[原始碼]¶
基礎:
DataplexCatalogBaseOperator刪除 Entry 資源。
另請參閱
有關如何使用此運算子的更多資訊,請參閱指南:刪除條目
- 引數:
entry_id (str (字串)) – 必需。條目識別符號。它必須在條目組內唯一。與 Google Cloud 資源對應的條目使用基於完整資源名稱的條目 ID 格式。格式為資源名稱,但省略了完整資源名稱中 API 服務名稱部分的雙斜槓字首。這允許使用與條目關聯的資源名稱檢索條目。例如,如果某個資源的完整資源名稱是
//library.googleapis.com/shelves/shelf1/books/book2,則建議的 entry_id 為library.googleapis.com/shelves/shelf1/books/book2。也建議對於與 Google Cloud 以外的提供商或系統的資源對應的條目,遵循相同的約定。欄位的最大大小為 4000 個字元。entry_group_id (str (字串)) – 必需。該建立的條目將屬於的 EntryGroup 資源名稱。
project_id – Required. 使用服務的 Google Cloud 專案 ID。
location – Required. 使用服務的 Google Cloud 區域 ID。
gcp_conn_id – Optional. 用於連線到 Google Cloud 的連線 ID。
retry – Optional. 用於重試請求的重試物件。如果指定為 None,則不會重試請求。
timeout – Optional. 等待請求完成的時間(秒)。請注意,如果指定了 retry,則超時時間應用於每次單獨的嘗試。
metadata – Optional. 提供給方法的附加元資料。
impersonation_chain – Optional. 用於使用短期憑據模擬的服務賬號,或者獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該 access_token 將在請求中被模擬。如果設定為字串,則此賬號必須授予發起賬號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中的身份必須將 Service Account Token Creator IAM 角色授予其直接前置身份,列表中的第一個賬號將此角色授予發起賬號(模板化)。
- template_fields: collections.abc.Sequence[str][原始碼]¶