airflow.providers.google.cloud.operators.dlp¶
各種 Google Cloud DLP 運算子,允許您使用 Cloud DLP 執行基本操作。
類¶
啟動對長時間執行的 DlpJob 的非同步取消。 |
|
建立一個去標識化模板,以重用內容、影像和儲存的常用配置。 |
|
建立一個新作業以檢查儲存或計算風險指標。 |
|
建立一個 InspectTemplate,以重用內容、影像和儲存的常用配置。 |
|
建立一個作業觸發器,以便按設定的時間表執行 DLP 操作,例如掃描儲存以查詢敏感資訊。 |
|
建立一個預構建的儲存資訊型別用於檢查。 |
|
從內容項中去標識化潛在的敏感資訊;限制輸入大小和輸出大小。 |
|
刪除一個 DeidentifyTemplate。 |
|
刪除一個長時間執行的 DlpJob。 |
|
刪除一個 InspectTemplate。 |
|
刪除一個作業觸發器。 |
|
刪除一個儲存資訊型別。 |
|
獲取一個 DeidentifyTemplate。 |
|
獲取長時間執行的 DlpJob 的最新狀態。 |
|
獲取一個 InspectTemplate。 |
|
獲取一個作業觸發器。 |
|
獲取一個儲存資訊型別。 |
|
在內容中查詢潛在的敏感資訊;限制輸入大小、處理時間和輸出大小。 |
|
列出去標識化模板。 |
|
列出請求中與指定過濾器匹配的 DlpJobs。 |
|
返回 DLP API 支援的敏感資訊型別列表。 |
|
列出 InspectTemplates。 |
|
列出作業觸發器。 |
|
列出儲存資訊型別。 |
|
從影像中編輯潛在的敏感資訊;限制輸入大小、處理時間和輸出大小。 |
|
重新標識已被去標識化的內容。 |
|
更新 DeidentifyTemplate。 |
|
更新 InspectTemplate。 |
|
更新作業觸發器。 |
|
透過建立新版本來更新儲存資訊型別。 |
模組內容¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPCancelDLPJobOperator(*, dlp_job_id, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator啟動對長時間執行的 DlpJob 的非同步取消。
參閱
有關如何使用此運算子的更多資訊,請參閱指南:取消作業
- 引數:
dlp_job_id (str) – 要取消的 DLP 作業資源的 ID。
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。如果設定為 None 或缺失,則使用 Google Cloud 連線中的預設 project_id。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('dlp_job_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPCreateDeidentifyTemplateOperator(*, organization_id=None, project_id=PROVIDE_PROJECT_ID, deidentify_template=None, template_id=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator建立一個去標識化模板,以重用內容、影像和儲存的常用配置。
參閱
有關如何使用此運算子的更多資訊,請參閱指南:去標識化模板
- 引數:
organization_id (str | None) – (可選) 組織 ID。如果父資源是組織,則必須設定此欄位。
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。僅當父資源是專案而不是組織時設定此欄位。
deidentify_template (dict | google.cloud.dlp_v2.types.DeidentifyTemplate | None) – (可選) 要建立的 DeidentifyTemplate。
template_id (str | None) – (可選) 模板 ID。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('organization_id', 'project_id', 'deidentify_template', 'template_id', 'gcp_conn_id',...[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPCreateDLPJobOperator(*, project_id=PROVIDE_PROJECT_ID, inspect_job=None, risk_job=None, job_id=None, retry=DEFAULT, timeout=None, metadata=(), wait_until_finished=True, gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator建立一個新作業以檢查儲存或計算風險指標。
參閱
有關如何使用此運算子的更多資訊,請參閱指南:建立作業
- 引數:
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。如果設定為 None 或缺失,則使用 Google Cloud 連線中的預設 project_id。
inspect_job (dict | google.cloud.dlp_v2.types.InspectJobConfig | None) – (可選) 檢查作業的配置。
risk_job (dict | google.cloud.dlp_v2.types.RiskAnalysisJobConfig | None) – (可選) 風險分析作業的配置。
job_id (str | None) – (可選) 作業 ID。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
wait_until_finished (bool) – (可選) 如果為 True,將持續輪詢作業狀態,直到狀態變為 DONE。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('project_id', 'inspect_job', 'risk_job', 'job_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPCreateInspectTemplateOperator(*, organization_id=None, project_id=PROVIDE_PROJECT_ID, inspect_template=None, template_id=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator建立一個 InspectTemplate,以重用內容、影像和儲存的常用配置。
參閱
有關如何使用此運算子的更多資訊,請參閱指南:建立模板
- 引數:
organization_id (str | None) – (可選) 組織 ID。如果父資源是組織,則必須設定此欄位。
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。僅當父資源是專案而不是組織時設定此欄位。
inspect_template (google.cloud.dlp_v2.types.InspectTemplate | None) – (可選) 要建立的 InspectTemplate。
template_id (str | None) – (可選) 模板 ID。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('organization_id', 'project_id', 'inspect_template', 'template_id', 'gcp_conn_id',...[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPCreateJobTriggerOperator(*, project_id=PROVIDE_PROJECT_ID, job_trigger=None, trigger_id=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator建立一個作業觸發器,以便按設定的時間表執行 DLP 操作,例如掃描儲存以查詢敏感資訊。
參閱
有關如何使用此 operator 的更多資訊,請參閱指南: 建立作業觸發器
- 引數:
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。如果設定為 None 或缺失,則使用 Google Cloud 連線中的預設 project_id。
job_trigger (dict | google.cloud.dlp_v2.types.JobTrigger | None) – (可選)要建立的 JobTrigger。
trigger_id (str | None) – (可選)JobTrigger ID。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('project_id', 'job_trigger', 'trigger_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPCreateStoredInfoTypeOperator(*, organization_id=None, project_id=PROVIDE_PROJECT_ID, config=None, stored_info_type_id=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator建立一個預構建的儲存資訊型別用於檢查。
參閱
有關如何使用此 operator 的更多資訊,請參閱指南: 建立儲存的資訊型別
- 引數:
organization_id (str | None) – (可選) 組織 ID。如果父資源是組織,則必須設定此欄位。
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。僅當父資源是專案而不是組織時設定此欄位。
config (google.cloud.dlp_v2.types.StoredInfoTypeConfig | None) – (可選)StoredInfoType 的配置。
stored_info_type_id (str | None) – (可選)StoredInfoType ID。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('organization_id', 'project_id', 'config', 'stored_info_type_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPDeidentifyContentOperator(*, project_id=PROVIDE_PROJECT_ID, deidentify_config=None, inspect_config=None, item=None, inspect_template_name=None, deidentify_template_name=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator從內容項中去標識化潛在的敏感資訊;限制輸入大小和輸出大小。
參閱
有關如何使用此 operator 的更多資訊,請參閱指南: 對內容進行去標識化
- 引數:
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。如果設定為 None 或缺失,則使用 Google Cloud 連線中的預設 project_id。
deidentify_config (dict | google.cloud.dlp_v2.types.DeidentifyConfig | None) – (可選)用於對內容項進行去標識化的配置。此處指定的項將覆蓋 deidentify_template_name 引數引用的模板中設定的配置。
inspect_config (dict | google.cloud.dlp_v2.types.InspectConfig | None) – (可選)檢查器的配置。此處指定的項將覆蓋 inspect_template_name 引數引用的模板中設定的配置。
item (dict | google.cloud.dlp_v2.types.ContentItem | None) – (可選)要進行去標識化的項。將視為文字處理。
inspect_template_name (str | None) – (可選)要使用的可選模板。直接在 inspect_config 中指定的任何配置將覆蓋模板中設定的配置。
deidentify_template_name (str | None) – (可選)要使用的可選模板。直接在 deidentify_config 中指定的任何配置將覆蓋模板中設定的配置。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('project_id', 'deidentify_config', 'inspect_config', 'item', 'inspect_template_name',...[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPDeleteDeidentifyTemplateOperator(*, template_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator刪除一個 DeidentifyTemplate。
參閱
有關如何使用此運算子的更多資訊,請參閱指南:去標識化模板
- 引數:
template_id (str) – 要刪除的去標識化模板的 ID。
organization_id (str | None) – (可選) 組織 ID。如果父資源是組織,則必須設定此欄位。
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。僅當父資源是專案而不是組織時設定此欄位。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('template_id', 'organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPDeleteDLPJobOperator(*, dlp_job_id, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator刪除一個長時間執行的 DlpJob。
此方法指示客戶端不再對 DlpJob 結果感興趣。如果可能,將取消作業。
參閱
有關如何使用此運算子的更多資訊,請參閱指南:刪除作業
- 引數:
dlp_job_id (str) – 要刪除的 DLP 作業資源的 ID。
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。如果設定為 None 或缺失,則使用 Google Cloud 連線中的預設 project_id。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('dlp_job_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPDeleteInspectTemplateOperator(*, template_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator刪除一個 InspectTemplate。
參閱
有關如何使用此運算子的更多資訊,請參閱指南:刪除模板
- 引數:
template_id (str) – 要刪除的檢查模板的 ID。
organization_id (str | None) – (可選) 組織 ID。如果父資源是組織,則必須設定此欄位。
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。僅當父資源是專案而不是組織時設定此欄位。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('template_id', 'organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPDeleteJobTriggerOperator(*, job_trigger_id, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator刪除一個作業觸發器。
參閱
有關如何使用此運算子的更多資訊,請參閱指南:內容方法
- 引數:
job_trigger_id (str) – 要刪除的 DLP 作業觸發器的 ID。
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。如果設定為 None 或缺失,則使用 Google Cloud 連線中的預設 project_id。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('job_trigger_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPDeleteStoredInfoTypeOperator(*, stored_info_type_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator刪除一個儲存資訊型別。
參閱
有關如何使用此運算子的更多資訊,請參閱指南:刪除儲存的資訊型別
- 引數:
stored_info_type_id (str) – 要刪除的儲存資訊型別的 ID。
organization_id (str | None) – (可選) 組織 ID。如果父資源是組織,則必須設定此欄位。
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。僅當父資源是專案而不是組織時設定此欄位。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('stored_info_type_id', 'organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPGetDeidentifyTemplateOperator(*, template_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator獲取一個 DeidentifyTemplate。
參閱
瞭解如何使用此 Operator 的更多資訊,請參閱指南: 去標識化模板
- 引數:
template_id (str) – 要讀取的去標識化模板的 ID。
organization_id (str | None) – (可選) 組織 ID。如果父資源是組織,則必須設定此欄位。
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。僅當父資源是專案而不是組織時設定此欄位。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('template_id', 'organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPGetDLPJobOperator(*, dlp_job_id, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator獲取長時間執行的 DlpJob 的最新狀態。
參閱
瞭解如何使用此 Operator 的更多資訊,請參閱指南: 檢索作業
- 引數:
dlp_job_id (str) – 要讀取的 DLP 作業資源的 ID。
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。如果設定為 None 或缺失,則使用 Google Cloud 連線中的預設 project_id。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('dlp_job_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPGetInspectTemplateOperator(*, template_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator獲取一個 InspectTemplate。
參閱
瞭解如何使用此 Operator 的更多資訊,請參閱指南: 檢索模板
- 引數:
template_id (str) – 要讀取的檢查模板的 ID。
organization_id (str | None) – (可選) 組織 ID。如果父資源是組織,則必須設定此欄位。
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。僅當父資源是專案而不是組織時設定此欄位。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('template_id', 'organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPGetDLPJobTriggerOperator(*, job_trigger_id, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator獲取一個作業觸發器。
參閱
瞭解如何使用此 Operator 的更多資訊,請參閱指南: 檢索作業觸發器
- 引數:
job_trigger_id (str) – 要讀取的 DLP 作業觸發器的 ID。
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。如果設定為 None 或缺失,則使用 Google Cloud 連線中的預設 project_id。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('job_trigger_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPGetStoredInfoTypeOperator(*, stored_info_type_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator獲取一個儲存資訊型別。
參閱
有關如何使用此 Operator 的更多資訊,請參閱指南: 檢索儲存的資訊型別
- 引數:
stored_info_type_id (str) – 要讀取的儲存資訊型別的 ID。
organization_id (str | None) – (可選) 組織 ID。如果父資源是組織,則必須設定此欄位。
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。僅當父資源是專案而不是組織時設定此欄位。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('stored_info_type_id', 'organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPInspectContentOperator(*, project_id=PROVIDE_PROJECT_ID, inspect_config=None, item=None, inspect_template_name=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator在內容中查詢潛在的敏感資訊;限制輸入大小、處理時間和輸出大小。
參閱
有關如何使用此 Operator 的更多資訊,請參閱指南: 使用模板
- 引數:
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。如果設定為 None 或缺失,則使用 Google Cloud 連線中的預設 project_id。
inspect_config (dict | google.cloud.dlp_v2.types.InspectConfig | None) – (可選)檢查器的配置。此處指定的項將覆蓋 inspect_template_name 引數引用的模板中設定的配置。
item (dict | google.cloud.dlp_v2.types.ContentItem | None) – (可選)要進行去標識化的項。將視為文字處理。
inspect_template_name (str | None) – (可選)要使用的可選模板。直接在 inspect_config 中指定的任何配置將覆蓋模板中設定的配置。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('project_id', 'inspect_config', 'item', 'inspect_template_name', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPListDeidentifyTemplatesOperator(*, organization_id=None, project_id=PROVIDE_PROJECT_ID, page_size=None, order_by=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator列出去標識化模板。
參閱
有關如何使用此 Operator 的更多資訊,請參閱指南: 去標識化模板
- 引數:
organization_id (str | None) – (可選) 組織 ID。如果父資源是組織,則必須設定此欄位。
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。僅當父資源是專案而不是組織時設定此欄位。
page_size (int | None) – (可選) 底層 API 響應中包含的最大資源數量。
order_by (str | None) – (可選) 可選的逗號分隔的欄位列表,用於排序,後跟 asc 或 desc 字尾。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPListDLPJobsOperator(*, project_id=PROVIDE_PROJECT_ID, results_filter=None, page_size=None, job_type=None, order_by=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator列出請求中與指定過濾器匹配的 DlpJobs。
參閱
有關如何使用此 Operator 的更多資訊,請參閱指南: 檢索作業
- 引數:
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。如果設定為 None 或缺失,則使用 Google Cloud 連線中的預設 project_id。
results_filter (str | None) – (可選) 用於指定結果子集的過濾器。
page_size (int | None) – (可選) 底層 API 響應中包含的最大資源數量。
job_type (str | None) – (可選) 作業型別。
order_by (str | None) – (可選) 可選的逗號分隔的欄位列表,用於排序,後跟 asc 或 desc 字尾。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPListInfoTypesOperator(*, project_id=PROVIDE_PROJECT_ID, language_code=None, results_filter=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator返回 DLP API 支援的敏感資訊型別列表。
參閱
有關如何使用此 Operator 的更多資訊,請參閱指南: 檢索儲存的資訊型別
- 引數:
language_code (str | None) – (可選) 用於本地化 infoType 友好名稱的可選 BCP-47 語言程式碼。如果省略,或如果本地化字串不可用,則將返回 en-US 字串。
results_filter (str | None) – (可選) 用於指定結果子集的過濾器。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('language_code', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPListInspectTemplatesOperator(*, organization_id=None, project_id=PROVIDE_PROJECT_ID, page_size=None, order_by=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator列出 InspectTemplates。
參閱
有關如何使用此 operator 的更多資訊,請參閱指南:檢索模板
- 引數:
organization_id (str | None) – (可選) 組織 ID。如果父資源是組織,則必須設定此欄位。
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。僅當父資源是專案而不是組織時設定此欄位。
page_size (int | None) – (可選) 底層 API 響應中包含的最大資源數量。
order_by (str | None) – (可選) 可選的逗號分隔的欄位列表,用於排序,後跟 asc 或 desc 字尾。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPListJobTriggersOperator(*, project_id=PROVIDE_PROJECT_ID, page_size=None, order_by=None, results_filter=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator列出作業觸發器。
參閱
有關如何使用此 operator 的更多資訊,請參閱指南:檢索作業觸發器
- 引數:
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。如果設定為 None 或缺失,則使用 Google Cloud 連線中的預設 project_id。
page_size (int | None) – (可選) 底層 API 響應中包含的最大資源數量。
order_by (str | None) – (可選) 可選的逗號分隔的欄位列表,用於排序,後跟 asc 或 desc 字尾。
results_filter (str | None) – (可選) 用於指定結果子集的過濾器。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPListStoredInfoTypesOperator(*, organization_id=None, project_id=PROVIDE_PROJECT_ID, page_size=None, order_by=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator列出儲存資訊型別。
參閱
有關如何使用此 operator 的更多資訊,請參閱指南:檢索儲存的資訊型別
- 引數:
organization_id (str | None) – (可選) 組織 ID。如果父資源是組織,則必須設定此欄位。
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。僅當父資源是專案而不是組織時設定此欄位。
page_size (int | None) – (可選) 底層 API 響應中包含的最大資源數量。
order_by (str | None) – (可選) 可選的逗號分隔的欄位列表,用於排序,後跟 asc 或 desc 字尾。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('organization_id', 'project_id', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPRedactImageOperator(*, project_id=PROVIDE_PROJECT_ID, inspect_config=None, image_redaction_configs=None, include_findings=None, byte_item=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator從影像中編輯潛在的敏感資訊;限制輸入大小、處理時間和輸出大小。
參閱
有關如何使用此 operator 的更多資訊,請參閱指南:參考
- 引數:
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。如果設定為 None 或缺失,則使用 Google Cloud 連線中的預設 project_id。
inspect_config (dict | google.cloud.dlp_v2.types.InspectConfig | None) – (可選)檢查器的配置。此處指定的項將覆蓋 inspect_template_name 引數引用的模板中設定的配置。
image_redaction_configs (None | list[dict] | list[google.cloud.dlp_v2.types.RedactImageRequest.ImageRedactionConfig]) – (可選)用於指定從影像中隱去哪些內容的配置。
include_findings (bool | None) – (可選)響應是否應包含查詢結果以及隱去的影像。
byte_item (dict | google.cloud.dlp_v2.types.ByteContentItem | None) – (可選)內容必須為 PNG、JPEG、SVG 或 BMP 格式。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('project_id', 'inspect_config', 'image_redaction_configs', 'include_findings', 'byte_item',...[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPReidentifyContentOperator(*, project_id=PROVIDE_PROJECT_ID, reidentify_config=None, inspect_config=None, item=None, inspect_template_name=None, reidentify_template_name=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator重新標識已被去標識化的內容。
參閱
有關如何使用此操作器的更多資訊,請參閱指南:重新標識內容
- 引數:
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。如果設定為 None 或缺失,則使用 Google Cloud 連線中的預設 project_id。
reidentify_config (dict | google.cloud.dlp_v2.types.DeidentifyConfig | None) – (可選)用於重新標識內容項的配置。
inspect_config (dict | google.cloud.dlp_v2.types.InspectConfig | None) – (可選)檢查器的配置。
item (dict | google.cloud.dlp_v2.types.ContentItem | None) – (可選)要重新標識的項。將視為文字處理。
inspect_template_name (str | None) – (可選)要使用的可選模板。直接在 inspect_config 中指定的任何配置將覆蓋模板中設定的配置。
reidentify_template_name (str | None) – (可選)可選的模板。引用 DeidentifyTemplate 的一個例項。直接在 reidentify_config 或 inspect_config 中指定的任何配置將覆蓋模板中設定的配置。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('project_id', 'reidentify_config', 'inspect_config', 'item', 'inspect_template_name',...[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPUpdateDeidentifyTemplateOperator(*, template_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, deidentify_template=None, update_mask=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator更新 DeidentifyTemplate。
參閱
有關如何使用此操作器的更多資訊,請參閱指南:去標識化模板
- 引數:
template_id (str) – 要更新的去標識化模板的 ID。
organization_id (str | None) – (可選) 組織 ID。如果父資源是組織,則必須設定此欄位。
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。僅當父資源是專案而不是組織時設定此欄位。
deidentify_template (dict | google.cloud.dlp_v2.types.DeidentifyTemplate | None) – 新的 DeidentifyTemplate 值。
update_mask (dict | google.protobuf.field_mask_pb2.FieldMask | None) – 用於控制哪些欄位需要更新的掩碼。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('template_id', 'organization_id', 'project_id', 'deidentify_template', 'update_mask',...[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPUpdateInspectTemplateOperator(*, template_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, inspect_template=None, update_mask=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator更新 InspectTemplate。
參閱
有關如何使用此操作器的更多資訊,請參閱指南:更新模板
- 引數:
template_id (str) – 要更新的檢查模板的 ID。
organization_id (str | None) – (可選) 組織 ID。如果父資源是組織,則必須設定此欄位。
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。僅當父資源是專案而不是組織時設定此欄位。
inspect_template (dict | google.cloud.dlp_v2.types.InspectTemplate | None) – 新的 InspectTemplate 值。
update_mask (dict | google.protobuf.field_mask_pb2.FieldMask | None) – 用於控制哪些欄位需要更新的掩碼。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('template_id', 'organization_id', 'project_id', 'inspect_template', 'update_mask',...[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPUpdateJobTriggerOperator(*, job_trigger_id, project_id=PROVIDE_PROJECT_ID, job_trigger=None, update_mask=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[source]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator更新作業觸發器。
參閱
有關如何使用此操作器的更多資訊,請參閱指南:更新作業觸發器
- 引數:
job_trigger_id – 要更新的 DLP 作業觸發器的 ID。
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。如果設定為 None 或缺失,則使用 Google Cloud 連線中的預設 project_id。
job_trigger (dict | google.cloud.dlp_v2.types.JobTrigger | None) – 新的 JobTrigger 值。
update_mask (dict | google.protobuf.field_mask_pb2.FieldMask | None) – 用於控制哪些欄位需要更新的掩碼。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('job_trigger_id', 'project_id', 'job_trigger', 'update_mask', 'gcp_conn_id', 'impersonation_chain')[source]¶
- class airflow.providers.google.cloud.operators.dlp.CloudDLPUpdateStoredInfoTypeOperator(*, stored_info_type_id, organization_id=None, project_id=PROVIDE_PROJECT_ID, config=None, update_mask=None, retry=DEFAULT, timeout=None, metadata=(), gcp_conn_id='google_cloud_default', impersonation_chain=None, **kwargs)[原始碼]¶
基類:
airflow.providers.google.cloud.operators.cloud_base.GoogleCloudBaseOperator透過建立新版本來更新儲存資訊型別。
參閱
有關如何使用此 operator 的更多資訊,請參閱指南:更新儲存的資訊型別
- 引數:
stored_info_type_id – 要更新的儲存資訊型別的 ID。
organization_id (str | None) – (可選) 組織 ID。如果父資源是組織,則必須設定此欄位。
project_id (str) – (可選) DLP 例項所在的 Google Cloud 專案 ID。僅當父資源是專案而不是組織時設定此欄位。
config (dict | google.cloud.dlp_v2.types.StoredInfoTypeConfig | None) – 儲存資訊型別的更新配置。如果未提供,則將使用現有配置建立一個新版本的儲存資訊型別。
update_mask (dict | google.protobuf.field_mask_pb2.FieldMask | None) – 用於控制哪些欄位需要更新的掩碼。
retry (google.api_core.retry.Retry | google.api_core.gapic_v1.method._MethodDefault) – (可選) 用於重試請求的重試物件。如果指定 None,則不重試請求。
timeout (float | None) – (可選) 等待請求完成的時間,以秒為單位。請注意,如果指定了 retry,則超時應用於每次嘗試。
metadata (collections.abc.Sequence[tuple[str, str]]) – (可選) 提供給方法的附加元資料。
gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。
impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選) 使用短期憑證模擬的服務帳號,或獲取列表中最後一個帳號的 access_token 所需的鏈式帳號列表,該帳號將在請求中被模擬。如果設定為字串,則該帳號必須授予發起帳號 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須授予其直接前一個身份 Service Account Token Creator IAM 角色,列表中第一個帳號授予發起帳號此角色(模板化)。
- template_fields: collections.abc.Sequence[str] = ('stored_info_type_id', 'organization_id', 'project_id', 'config', 'update_mask', 'gcp_conn_id',...[原始碼]¶