airflow.providers.amazon.aws.transfers.gcs_to_s3

此模組包含 Google Cloud Storage 到 S3 的運算子。

GCSToS3Operator

將 Google Cloud Storage 儲存桶與 S3 儲存桶同步。

模組內容

class airflow.providers.amazon.aws.transfers.gcs_to_s3.GCSToS3Operator(*, gcs_bucket, prefix=None, gcp_conn_id='google_cloud_default', dest_aws_conn_id='aws_default', dest_s3_key, dest_verify=None, replace=False, google_impersonation_chain=None, dest_s3_extra_args=None, s3_acl_policy=None, keep_directory_structure=True, match_glob=None, gcp_user_project=None, **kwargs)[source]

基類: airflow.models.BaseOperator

將 Google Cloud Storage 儲存桶與 S3 儲存桶同步。

另請參閱

有關如何使用此運算子的更多資訊,請參閱指南:Google Cloud Storage 到 Amazon S3

引數:
  • gcs_bucket (str) – 要查詢物件的 Google Cloud Storage 儲存桶。(templated)

  • prefix (str | None) – 用於過濾物件名稱以此字首開頭的字串。(templated)

  • gcp_conn_id (str) – (可選) 用於連線到 Google Cloud 的連線 ID。

  • dest_aws_conn_id (str | None) – 目標 S3 連線

  • dest_s3_key (str) – 用於儲存檔案的基礎 S3 鍵。(templated)

  • dest_verify (str | bool | None) –

    是否驗證 S3 連線的 SSL 證書。預設情況下,SSL 證書會經過驗證。您可以提供以下值:

    • False: 不驗證 SSL 證書。SSL 仍將使用

      (除非 use_ssl 為 False),但 SSL 證書不會被驗證。

    • path/to/cert/bundle.pem: 要使用的 CA 證書包的檔名。

      如果您想使用與 botocore 不同的 CA 證書包,可以指定此引數。

  • replace (bool) – 是否驗證目標儲存桶中檔案的存在。預設為 False。如果設定為 True,將上傳所有檔案,替換目標儲存桶中現有的檔案。如果設定為 False,將只上傳源中存在但目標儲存桶中不存在的檔案。

  • google_impersonation_chain (str | collections.abc.Sequence[str] | None) – (可選)要使用短期憑據模擬的 Google 服務賬號,或獲取列表中最後一個賬號的 access_token 所需的賬號鏈式列表,該賬號將在請求中被模擬。如果設定為字串,則該賬號必須向原始賬號授予 Service Account Token Creator IAM 角色。如果設定為序列,則列表中身份必須將 Service Account Token Creator IAM 角色授予直接前一個身份,其中列表中的第一個賬號將此角色授予原始賬號。(templated)

  • s3_acl_policy (str | None) – (可選)用於指定要上傳到 S3 的物件的預設 ACL 策略的字串

  • keep_directory_structure (bool) – (可選) 當設定為 False 時,儲存桶上檔案的路徑將在 dest_s3_key 中傳遞的路徑內重新建立。

  • match_glob (str | None) – (可選) 根據字串給定的 glob 模式過濾物件(例如,'**/*/.json'

  • gcp_user_project (str | None) – (可選) 要為此請求計費的 Google Cloud 專案識別符號。Requester Pays 儲存桶必需。

template_fields: collections.abc.Sequence[str] = ('gcs_bucket', 'prefix', 'dest_s3_key', 'google_impersonation_chain', 'gcp_user_project')[source]
ui_color = '#f0eee4'[source]
gcs_bucket[source]
prefix = None[source]
gcp_conn_id = 'google_cloud_default'[source]
dest_aws_conn_id = 'aws_default'[source]
dest_s3_key[source]
dest_verify = None[source]
replace = False[source]
google_impersonation_chain = None[source]
dest_s3_extra_args[source]
s3_acl_policy = None[source]
keep_directory_structure = True[source]
match_glob = None[source]
gcp_user_project = None[source]
execute(context)[source]

建立運算子時進行派生。

Context 與渲染 jinja 模板時使用的字典相同。

有關更多 context 資訊,請參閱 get_template_context。

此條目有幫助嗎?