apache-airflow-providers-google

Changelog

15.1.0

新特性

  • 新增 ORC 支援 GCSToBigQueryOperator 並且 測試 外部 (#49188)

Bug 修復

  • 修復 OperationHelper wait_for_operation_result 預設值 (#49121)

  • 修復 Managed Kafka 服務的 get_confluent_token 回撥 (#48926)

  • 修復: BigQuery 連線 UI 編輯時 '使用 Legacy SQL' 預設設定為 true (#49038)

其他

  • 移除 多餘的 else 程式碼塊 (#49199)

  • 棄用 DataflowHook 中的 start_sql_job (#48663)

  • type: 註釋 'provider' 中缺少 type (#49130)

15.0.1

其他

  • 棄用 Life Scrience 服務 (#48862)

僅文件

  • google 文件中新增 缺失的 license 註釋 (#48985)

15.0.0

重大變更

警告

已從 Google provider 包中刪除已棄用的類、引數和特性。引入了以下重大變更:

  • 運算子

    • 移除 MLEngineStartBatchPredictionJobOperator, 使用 CreateBatchPredictionJobOperator 代替

    • 移除 MLEngineManageModelOperator, 使用 Vertex AI 的 MLEngineCreateModelOperator 或者 GetModelOperator 代替

    • 移除 MLEngineDeleteModelOperator, 使用 Vertex AI 的 DeleteModelOperator 代替

    • 移除 MLEngineManageVersionOperator, 使用 Vertex AI 的適當的運算子代替, 例如 AddVersionAliasesOnModelOperator

    • 移除 MLEngineCreateVersionOperator, VertexAI 運算子使用 parent_model 引數

    • 移除 MLEngineSetDefaultVersionOperator, 使用 Vertex AI 的 SetDefaultVersionOnModelOperator 代替

    • 移除 MLEngineListVersionsOperator, 使用 Vertex AI 的 ListModelVersionsOperator 代替

    • 移除 MLEngineDeleteVersionOperator, 使用 Vertex AI 的 DeleteModelVersionOperator 代替

    • 移除 MLEngineStartTrainingJobOperator, 使用 Vertex AI 的 CreateCustomPythonPackageTrainingJobOperator 代替

    • 移除 MLEngineTrainingCancelJobOperator, 使用 Vertex AI 的 CancelCustomTrainingJobOperator 代替

    • 移除 DataProcScaleClusterOperator, 使用 DataprocUpdateClusterOperator 代替

    • 移除 GoogleAdsToGcsOperatorpage_size 引數

    • 移除 DeleteAutoMLTrainingJobOperator.training_pipeline 方法, 使用 training_pipeline_id 引數代替

    • 移除 DeleteCustomTrainingJobOperator.training_pipeline 方法, 使用 training_pipeline_id 引數代替

    • 移除 DeleteCustomTrainingJobOperator.custom_job 方法, 使用 custom_job_id 引數代替

  • 連結

    • 移除 DataFusionPipelineLinkHelper, 使用 airflow.providers.google.cloud.utils.helpers.resource_path_to_dict 代替

  • Hooks

    • 移除 GoogleAdsHook.search, GoogleAdsHook.search_proto_plus, GoogleAdsHook._search 方法的 page_size 引數

    • 移除 CloudBuildHook.create_build 方法, 使用 CloudBuildHook.create_build_without_waiting_for_result 方法

    • 移除 DataflowHook.start_java_dataflow 方法, 請使用 airflow.providers.apache.beam.hooks.beam.start.start_java_pipeline 方法啟動管道, 並使用 providers.google.cloud.hooks.dataflow.DataflowHook.wait_for_done 方法等待所需的管道狀態

    • 移除 DataflowHook.start_python_dataflow 方法, 請使用 airflow.providers.apache.beam.hooks.beam.start.start_python_pipeline 方法啟動管道, 並使用 providers.google.cloud.hooks.dataflow.DataflowHook.wait_for_done 方法等待所需的管道狀態

    • 移除 CustomJobHook.cancel_pipeline_job 方法, 使用 PipelineJobHook.cancel_pipeline_job 方法代替

    • 移除 CustomJobHook.create_pipeline_job 方法, 使用 PipelineJobHook.create_pipeline_job 方法代替

    • 移除 CustomJobHook.get_pipeline_job 方法, 使用 PipelineJobHook.get_pipeline_job 方法代替

    • 移除 CustomJobHook.list_pipeline_jobs 方法, 使用 PipelineJobHook.list_pipeline_jobs 方法代替

    • 移除 CustomJobHook.delete_pipeline_job 方法, 使用 PipelineJobHook.delete_pipeline_job 方法代替

    • 移除 GoogleBaseHook.get_client_info 方法, 使用 airflow.providers.google.common.consts.CLIENT_INFO 代替

    • LifeSciencesHook 生命週期延長至 2025 年 7 月 8 日

  • Utils

    • 移除 create_evaluate_ops 方法

  • 移除 provider/google 2025 2 月和 3 已棄用項。 #48018

新特性

  • SFTPToGCSOperator: 添加了 選項 來直接將資料流式傳輸到 GCS 而無需儲存到磁碟 (#48107)

Bug 修復

  • 修復: 移除 'MetastoreHivePartitionSensor.poke' 方法中 檔案 URI 形成中 多餘的 斜槓字元。 (#48731)

  • 不允許 types-protobuf 5.29.1.20250402 用於 google 來修復 mypy (#48666)

其他

  • 新增 'ti' RemoteLogIO 讀取和上傳 方法 (#48804)

  • 重構 structlog 時代的遠端任務日誌處理。 (#48491)

  • 基類 移動到 'airflow.sdk.bases' (#48487)

  • 'BaseSensorOperator' 移動到 TaskSDK 定義 (#48244)

14.1.0

功能特性

  • 為 GKE Hooks 和 Operators 新增 DNS 終端節點支援 (#48075)

  • 特性:允許為 'DataprocCreateBatchOperator' 設定任務/DAG 標籤 (#46781)

  • 建立用於處理 GCP Apache Kafka 的 Consumer Groups 的 operators (#47056)

Bug 修復

  • 修復:BigQuery 可追溯性標籤在 TaskGroup 中缺失 (#47583)

其他

  • Vendor-in json-merge-patch 併為直接 uv 工具安裝新增 '--no-dev' (#48210)

  • 序列化複合傳輸中包含的 http 傳輸 (#47444)

  • AIP-72:處理 Task SDK 上的自定義 XCom 後端 (#47339)

  • 其他:更新 Google ADS 的 API 版本 (#47772)

  • 引入操作輔助類並重構 (#45354)

  • 從核心 Airflow 中刪除身份驗證後端 (#47399)

  • 將 Google Oauth2 後端標記為僅 Airflow 2 (#47622)

  • 新增 Dataflow Apache Beam Java 流系統測試 (#47209)

  • 將舊版名稱空間包新增到 airflow.providers (#47064)

14.0.0

注意

此版本沒有程式碼更改。 由於之前版本因打包問題而被撤回而釋出。

13.0.0

重大變更

警告

已從 Google provider 包中刪除已棄用的類、引數和特性。引入了以下重大變更:

  • 運算子

    • 刪除 AutoMLBatchPredictOperator。 請改用來自 airflow.providers.google.cloud.operators.vertex_ai.batch_prediction_job 的 operators

    • 刪除 DataflowStartSqlJobOperator。 請使用 DataflowStartYamlJobOperator 代替

    • 刪除 PromptLanguageModelOperator。 請使用 TextGenerationModelPredictOperator 代替

    • 刪除 GenerateTextEmbeddingsOperator。 請使用 TextEmbeddingModelGetEmbeddingsOperator 代替

    • 刪除 PromptMultimodalModelOperator。 請使用 GenerativeModelGenerateContentOperator 代替

    • 刪除 PromptMultimodalModelWithMediaOperator。 請使用 GenerativeModelGenerateContentOperator 代替

  • Hooks

    • 刪除 GenerativeModelHook.prompt_multimodal_model_with_media()。 請使用 GenerativeModelHook.generative_model_generate_content() 代替

    • 刪除 GenerativeModelHook.prompt_multimodal_model()。 請使用 GenerativeModelHook.generative_model_generate_content() 代替

    • 刪除 GenerativeModelHook.get_generative_model_part()。 請使用 GenerativeModelHook.generative_model_generate_content() 代替

    • 刪除 GenerativeModelHook.prompt_language_model()。 請使用 GenerativeModelHook.text_generation_model_predict() 代替

    • 刪除 GenerativeModelHook.generate_text_embeddings()。 請使用 GenerativeModelHook.text_generation_model_predict() 代替

  • 從 Google provider 中刪除已棄用的功能 (#46235)

功能特性

  • 建立用於處理 GCP Apache Kafka 的 Clusters 的 operators (#45795)

  • 棄用舊的 bigquery operators 並引入 CreateTableOperator (#46673)

  • 為 Entry 資源新增 operators (#46647)

  • 將可延遲模式新增到 PubSubPullOperator (#45835)

  • 將可延遲模式新增到 google cloud storage 傳輸感測器和 operators (#45754)

  • 為 AspectType 資源新增 operators (#46240)

  • 特性:為 BigQueryDataTransferServiceStartTransferRunsOperator 新增 OpenLineage 支援 (#45801)

  • 特性:為 CloudSQLExecuteQueryOperator 新增 OpenLineage 支援 (#45182)

  • 為 Entry Type 新增新 operators (#45799)

  • 新增 Dataplex Catalog Entry Group operators (#45751)

  • 特性:為 BigQueryHook 新增 Hook Level Lineage 支援 (#45706)

  • 特性:為 MsSqlHook 和 MSSQLToGCSOperator 新增 OpenLineage 支援 (#45637)

  • 將 holiday_region 引數新增到 AutoMl hook 中的 create_auto_ml_forecasting_training_job 中 (#45465)

  • 特性:自動將 OL 傳輸資訊注入到 spark 作業中 (#45326)

  • 特性:為 GCS 和 SFTP 之間的傳輸 operators 新增 OpenLineage 支援 (#45485)

  • 實現 AlloyDB 建立/更新/刪除使用者和備份 operators (#45378)

  • 特性:為一些 SQL 到 GCS operators 新增 OpenLineage 支援 (#45242)

  • 特性:為一些 BQ operators 新增 OpenLineage 支援 (#45422)

  • 特性:為 BigQueryInsertJobOperator 中的非查詢作業新增 OpenLineage 支援 (#44996)

  • 特性:自動將 OL 資訊注入到 DataprocInstantiateInlineWorkflowTemplateOperator 中的 spark 作業中 (#44697)

  • 特性:在 BigQueryInsertJobOperator 中將 CLL 新增到 OpenLineage (#44872)

  • 特性:自動將 OL 資訊注入到 DataprocCreateBatchOperator 中的 spark 作業中 (#44612)

  • 實現 AlloyDB 建立/更新/刪除例項 operators (#45241)

  • 新增 BigQuery 作業連結 (#45020) (#45222)

  • 引入 gcp translation(V3) 詞彙表 providers (#45085)

  • 將 dependencies 部分新增到 gcp cloud build 例項響應中 (#46947)

  • 建立 用於 處理 GCP Apache Kafka 主題 運算子 (#46865)

Bug 修復

  • 修復 BigQueryInsertJobOperator 中,當 async deffed 之前 完成時,返回 job_id (#46753)

  • 修復: 如果沒有 OpenLineage,Dataproc 運算子 匯入失敗 (#46561)

  • CloudComposerDAGRunSensor 新增 Airflow 版本的 向後相容性 (#46011)

  • 改進 google 憑據 錯誤訊息 (#45553)

  • CloudSqlProxyRunner 中新增 aarch64 環境的 case (#45488)

  • 修復 GCSToGCSOperator replace False 時,複製 單個 物件 bug (#45181)

其他

  • 重構 TriggererJobRunner 以在沒有 DB 訪問的程序中執行 triggers (#46677)

  • AIP-72: 改進 運算子 連結 介面 以防止 使用者程式碼 Webserver 中執行 (#46613)

  • 移除 Google Provider 中的 Airflow 3 棄用警告,移動到 Private Warning (#46599)

  • evaluation extra 新增到 google-cloud-aiplatform (#46270)

  • 限制 'google-cloud-aiplatform' 以修復 CI 中的問題 (#46242)

  • 改進 cloud_composer.rst 中的 語法 (#45708)

  • AIP-72: 支援 SDK Context dict 更好的型別提示 (#45583)

  • 棄用 Google Ads API v17 及更高版本的 page_size 引數 (#45239)

  • 刪除 pre-python 3.9 的過時 pandas 規範 (#45399)

  • apache-airflow-providers-google 包的 棄用策略 (#44985)

  • 新增 alloydb 的下限 (#45180)

  • 棄用 gcp AutoML 模組 (#44875)

  • 重構 BeamRunPythonPipelineOperator BeamRunJavaPipelineOperator 的可延遲模式 (#46678)

  • cloud build 提升到 3.31.0 (#46953)

12.0.0

注意

Apache Airflow providers support policy中所述,此 provider 版本僅適用於 Airflow 2.9+。

不相容變更

警告

已從 Google provider 包中刪除已棄用的類、引數和特性。引入了以下重大變更:

  • 運算子

    • 已移除 CreateDataPipelineOperator。請改用 DataflowCreatePipelineOperator

    • 已移除 RunDataPipelineOperator。請改用 DataflowRunPipelineOperator

    • 已移除 CreateDataPipelineOperator。請改用 DataflowCreatePipelineOperator

    • 已移除 RunDataPipelineOperator。請改用 DataflowRunPipelineOperator

  • Hooks

    • 已移除 DataPipelineHook。請改用 DataflowHook

    • 已移除 DataPipelineHook。請改用 DataflowHook。

  • Google provider 刪除 已棄用 到達移除日期 (2024年12月) (#45084)

特性

  • 新增 Google Vertex AI Feature Store - Feature View 同步 運算子,感測器 (#44891)

  • 引入 gcp translation(V3),翻譯 文件 providers (#44971)

  • 引入 translation API v3 (高階)模型 運算子。 (#44627)

  • 支援 Dataproc SQL 作業中的 多個 SQL 查詢 (#44890)

  • feat: BigQuery 建立表 運算子新增 OpenLineage 支援 (#44783)

  • feat: S3ToGCSOperator 新增 OpenLineage 支援 (#44426)

  • feat: DataprocSubmitJobOperator 中自動將 OL 資訊注入到 spark 作業中 (#44477)

  • 實現 AlloyDB 運算子:建立/更新/刪除 叢集 (#45027)

Bug 修復

  • 修復 由於重複的別名而導致的 MetastoreHivePartitionSensor 失敗 (#45001)

  • 修復 InsertBigQueryOperator OpenLineage 發射失敗 (#44650)

  • BigQueryInsertJobOperator: 記錄瞬態錯誤,並在將任務標記為成功之前檢查作業狀態 (#44279)

  • 使 'CloudBatchSubmitJobOperator' 在作業失敗時失敗 (#44425)

其他

  • 刪除對 AIRFLOW_V_2_9_PLUS 的引用 (#44987)

  • providers 中一致地檢查 Airflow 版本 (#44686)

  • 修復 yoda-conditions (#44466)

  • feat: gcs local 之間的 傳輸 運算子新增 OpenLineage 支援 (#44417)

  • providers 中的最小 Airflow 版本提升到 Airflow 2.9.0 (#44956)

  • chore: OpenLineage utils 中刪除已棄用的 bigquery facets (#44838)

  • 實現 KubernetesInstallKueueOperator (#44568)

  • 修復 dataform 運算子的 文件 (#44729)

  • 棄用 VertexAI PaLM 文字生成模型 (#44719)

  • 在文件中顯示關於棄用的醒目警告 (#44479)

  • chore: 統一處理 gcs 路徑 (#44410)

11.0.0

不相容變更

警告

已從 Google provider 包中刪除已棄用的類、引數和特性。引入了以下重大變更:

  • 運算子

    • 已移除 CreateAutoMLTextTrainingJobOperator。請改用 SupervisedFineTuningTrainOperator

    • 已移除 BigQueryExecuteQueryOperator。請改用 BigQueryInsertJobOperator

    • 已移除 BigQueryPatchDatasetOperator。請改用 BigQueryUpdateDatasetOperator

    • 已移除 DataflowCreateJavaJobOperator。請改用 BeamRunJavaPipelineOperator

    • 移除了 DataflowCreatePythonJobOperator。請使用 BeamRunPythonPipelineOperator 代替。

    • 移除了 DataprocSubmitPigJobOperator。請使用 DataprocSubmitJobOperator 代替。

    • 移除了 DataprocSubmitHiveJobOperator。請使用 DataprocSubmitJobOperator 代替。

    • 移除了 DataprocSubmitSparkSqlJobOperator。請使用 DataprocSubmitJobOperator 代替。

    • 移除了 DataprocSubmitSparkJobOperator。請使用 DataprocSubmitJobOperator 代替。

    • 移除了 DataprocSubmitHadoopJobOperator。請使用 DataprocSubmitJobOperator 代替。

    • 移除了 DataprocSubmitPySparkJobOperator。請使用 DataprocSubmitJobOperator 代替。

    • 移除了 GoogleAnalyticsListAccountsOperator。請使用 GoogleAnalyticsAdminListAccountsOperator 代替。

    • 移除了 GoogleAnalyticsGetAdsLinkOperator。請使用 GoogleAnalyticsAdminGetGoogleAdsLinkOperator 代替。

    • 移除了 GoogleAnalyticsRetrieveAdsLinksListOperator。請使用 GoogleAnalyticsAdminListGoogleAdsLinksOperator 代替。

    • 移除了 GoogleAnalyticsDataImportUploadOperator。請使用 GoogleAnalyticsAdminCreateDataStreamOperator 代替。

    • 移除了 GoogleAnalyticsDeletePreviousDataUploadsOperator。請使用 GoogleAnalyticsAdminDeleteDataStreamOperator 代替。

    • 移除了 GoogleAnalyticsModifyFileHeadersDataImportOperator。由於 Google Analytics API v3 已停止服務,該類已不再實際使用,因此所涵蓋的用例不再相關。

    • 移除了 GoogleCampaignManagerDeleteReportOperator.delegate_to。請使用 GoogleCampaignManagerDeleteReportOperator.impersonation_chain 代替。

    • 移除了 GoogleCampaignManagerDownloadReportOperator.delegate_to。請使用 GoogleCampaignManagerDownloadReportOperator.impersonation_chain 代替。

    • 移除了 GoogleCampaignManagerInsertReportOperator.delegate_to。請使用 GoogleCampaignManagerInsertReportOperator.impersonation_chain 代替。

    • 移除了 GoogleCampaignManagerRunReportOperator.delegate_to。請使用 GoogleCampaignManagerRunReportOperator.impersonation_chain 代替。

    • 移除了 GoogleCampaignManagerBatchInsertConversionsOperator.delegate_to。請使用 GoogleCampaignManagerBatchInsertConversionsOperator.impersonation_chain 代替。

    • 移除了 GoogleCampaignManagerBatchUpdateConversionsOperator.delegate_to。請使用 GoogleCampaignManagerBatchUpdateConversionsOperator.impersonation_chain 代替。

    • 移除了 GoogleDisplayVideo360CreateQueryOperator.delegate_to。請使用 GoogleDisplayVideo360CreateQueryOperator.impersonation_chain 代替。

    • 移除了 GoogleDisplayVideo360DeleteReportOperator.delegate_to。請使用 GoogleDisplayVideo360DeleteReportOperator.impersonation_chain 代替。

    • 移除了 GoogleDisplayVideo360DownloadReportV2Operator.delegate_to。請使用 GoogleDisplayVideo360DownloadReportV2Operator.impersonation_chain 代替。

    • 移除了 GoogleDisplayVideo360RunQueryOperator.delegate_to。請使用 GoogleDisplayVideo360RunQueryOperator.impersonation_chain 代替。

    • 移除了 GoogleDisplayVideo360DownloadLineItemsOperator.delegate_to。請使用 GoogleDisplayVideo360DownloadLineItemsOperator.impersonation_chain 代替。

    • 移除了 GoogleDisplayVideo360UploadLineItemsOperator.delegate_to。請使用 GoogleDisplayVideo360UploadLineItemsOperator.impersonation_chain 代替。

    • 移除了 GoogleDisplayVideo360CreateSDFDownloadTaskOperator.delegate_to。請使用 GoogleDisplayVideo360CreateSDFDownloadTaskOperator.impersonation_chain 代替。

    • 移除了 GoogleDisplayVideo360SDFtoGCSOperator.delegate_to。請使用 GoogleDisplayVideo360SDFtoGCSOperator.impersonation_chain 代替。

    • 移除了 GoogleSheetsCreateSpreadsheetOperator.delegate_to。請使用 GoogleSheetsCreateSpreadsheetOperator.impersonation_chain 代替。

    • 移除了 GCSToGoogleDriveOperator.delegate_to。請使用 GCSToGoogleDriveOperator.impersonation_chain 代替。

    • 移除了 GCSToGoogleSheetsOperator.delegate_to。請使用 GCSToGoogleSheetsOperator.impersonation_chain 代替。

    • 移除了 LocalFilesystemToGoogleDriveOperator.delegate_to。請使用 LocalFilesystemToGoogleDriveOperator.impersonation_chain 代替。

    • 移除了 SQLToGoogleSheetsOperator.delegate_to。請使用 SQLToGoogleSheetsOperator.impersonation_chain 代替。

    • 移除了 CreateBatchPredictionJobOperator.sync。此引數不再實際使用。

    • 移除了 CreateHyperparameterTuningJobOperator.sync。此引數不再實際使用。

    • 移除了 CustomTrainingJobBaseOperator.sync。此引數不再實際使用。

    • 移除了 GKEStartPodOperator.get_gke_config_file()。請使用 GKEStartPodOperator.fetch_cluster_info() 代替。

  • 觸發器

    • 移除了 GCSCheckBlobUpdateTimeTrigger.hook_params 引數中對 delegate_to 欄位的支援。

  • 感測器

    • 移除了 BigQueryTableExistenceAsyncSensor。請使用 BigQueryTableExistenceSensor 並將 deferrable 屬性設定為 True 代替。

    • 移除了 BigQueryTableExistencePartitionAsyncSensor。請使用 BigQueryTablePartitionExistenceSensor 並將 deferrable 屬性設定為 True 代替。

    • 移除了 CloudComposerEnvironmentSensor。請使用 CloudComposerCreateEnvironmentOperatorCloudComposerUpdateEnvironmentOperatorCloudComposerDeleteEnvironmentOperator 代替。

    • 移除了 GCSObjectExistenceAsyncSensor。請使用 GCSObjectExistenceSensor 並將 deferrable 屬性設定為 True 代替。

    • 移除了 GoogleCampaignManagerReportSensor.delegate_to。請使用 GoogleCampaignManagerReportSensor.impersonation_chain 代替。

    • 移除了 GoogleDisplayVideo360GetSDFDownloadOperationSensor.delegate_to。請使用 GoogleDisplayVideo360GetSDFDownloadOperationSensor.impersonation_chain 代替。

    • 移除了 GoogleDisplayVideo360RunQuerySensor.delegate_to。請使用 GoogleDisplayVideo360RunQuerySensor.impersonation_chain 代替。

    • 移除了 GoogleDriveFileExistenceSensor.delegate_to。請使用 GoogleDriveFileExistenceSensor.impersonation_chain 代替。

  • 連結

    • 移除了 BigQueryConsoleIndexableLink。此屬性不再實際使用。

    • 移除了 BigQueryConsoleLink。此屬性不再實際使用。

  • Hooks

    • 移除了 GKEDeploymentHook。請使用 GKEKubernetesHook 代替。

    • 移除了 GKECustomResourceHook。請使用 GKEKubernetesHook 代替。

    • 移除了 GKEPodHook。請使用 GKEKubernetesHook 代替。

    • 移除了 GKEJobHook。請使用 GKEKubernetesHook 代替。

    • 移除了 GKEPodAsyncHook。請使用 GKEKubernetesAsyncHook 代替。

    • 移除了 SecretsManagerHook。請使用 GoogleCloudSecretManagerHook 代替。

    • 移除了 GoogleAnalyticsHook。由於 Google Analytics API v3 已停止服務,該類已不再實際使用。

    • 移除了 GoogleBaseHook.delegate_to。請使用 GoogleBaseHook.impersonation_chain。請注意,delegate_to 引數過去在所有 Google hooks 中都繼承,並且從現在起,它在 Google provider 中的所有位置都已被刪除。

    • 移除了 GoogleDiscoveryApiHook.delegate_to。請使用 GoogleDiscoveryApiHook.impersonation_chain 代替。

    • 移除了 GoogleCampaignManagerHook.delegate_to。請使用 GoogleCampaignManagerHook.impersonation_chain 代替。

    • 移除了 GoogleDisplayVideo360Hook.delegate_to。請使用 GoogleDisplayVideo360Hook.impersonation_chain 代替。

    • 移除了 GoogleSearchAdsHook.delegate_to。請使用 GoogleSearchAdsHook.impersonation_chain 代替。

    • 移除了 GoogleCalendarHook.delegate_to。請使用 GoogleCalendarHook.impersonation_chain 代替。

    • 移除了 GoogleDriveHook.delegate_to。請使用 GoogleDriveHook.impersonation_chain 代替。

    • 移除了 GSheetsHook.delegate_to。請使用 GSheetsHook.impersonation_chain 代替。

    • 移除了 BigQueryHook.credentials_path。此屬性不再實際使用。

    • 已移除 GKEHook.get_conn()。請改用 GKEHook.get_cluster_manager_client()

    • 已移除 GKEHook.get_client()。請改用 GKEHook.get_cluster_manager_client()

    • 已移除 BigQueryHook.patch_table()。請改用 BigQueryHook.update_table()

    • 已移除 BigQueryHook.patch_dataset()。請改用 BigQueryHook.update_dataset()

    • 已移除 BigQueryHook.get_dataset_tables_list()。請改用 BigQueryHook.get_dataset_tables()

    • 已移除 BigQueryHook.run_table_delete()。請改用 BigQueryHook.delete_table()

    • 已移除 BigQueryHook.get_tabledata()。請改用 BigQueryHook.list_rows()

    • 已移除 BigQueryHook.cancel_query()。請改用 BigQueryHook.cancel_job()

    • 已移除 BigQueryHook.run_with_configuration()。請改用 BigQueryHook.insert_job()

    • 已移除 BigQueryHook.run_load()。請改用 BigQueryHook.insert_job()

    • 已移除 BigQueryHook.run_copy()。請改用 BigQueryHook.insert_job()

    • 已移除 BigQueryHook.run_extract()。請改用 BigQueryHook.insert_job()

    • 已移除 BigQueryHook.run_query()。請改用 BigQueryHook.insert_job()

    • 已移除 BigQueryHook.create_external_table()。請改用 BigQueryHook.create_empty_table()

    • 已移除 BigQueryHook.get_service()。請改用 BigQueryHook.get_client()

  • 後端

    • 已移除 CloudSecretManagerBackend.get_conn_uri()。請改用 CloudSecretManagerBackend.get_conn_value()

  • 其他棄用

    • 已移除 BigQueryBaseCursor.create_empty_table()。請改用 BigQueryHook.create_empty_table()

    • 已移除 BigQueryBaseCursor.create_empty_dataset()。請改用 BigQueryHook.create_empty_dataset()

    • 已移除 BigQueryBaseCursor.get_dataset_tables()。請改用 BigQueryHook.get_dataset_tables()

    • 已移除 BigQueryBaseCursor.delete_dataset()。請改用 BigQueryHook.delete_dataset()

    • 已移除 BigQueryBaseCursor.create_external_table()。請改用 BigQueryHook.create_empty_table()

    • 已移除 BigQueryBaseCursor.patch_table()。請改用 BigQueryHook.update_table()

    • 已移除 BigQueryBaseCursor.insert_all()。請改用 BigQueryHook.insert_all()

    • 已移除 BigQueryBaseCursor.update_dataset()。請改用 BigQueryHook.update_dataset()

    • 已移除 BigQueryBaseCursor.patch_dataset()。請改用 BigQueryHook.update_dataset()

    • 已移除 BigQueryBaseCursor.get_dataset_tables_list()。請改用 BigQueryHook.get_dataset_tables()

    • 已移除 BigQueryBaseCursor.get_datasets_list()。請改用 BigQueryHook.get_datasets_list()

    • 已移除 BigQueryBaseCursor.get_dataset()。請改用 BigQueryHook.get_dataset()

    • 已移除 BigQueryBaseCursor.run_grant_dataset_view_access()。請改用 BigQueryHook.run_grant_dataset_view_access()

    • 已移除 BigQueryBaseCursor.run_table_upsert()。請改用 BigQueryHook.run_table_upsert()

    • 已移除 BigQueryBaseCursor.run_table_delete()。請改用 BigQueryHook.delete_table()

    • 已移除 BigQueryBaseCursor.get_tabledata()。請改用 BigQueryHook.list_rows()

    • 已移除 BigQueryBaseCursor.get_schema()。請改用 BigQueryHook.get_schema()

    • 已移除 BigQueryBaseCursor.poll_job_complete()。請改用 BigQueryHook.poll_job_complete()

    • 已移除 BigQueryBaseCursor.cancel_query()。請改用 BigQueryHook.cancel_job()

    • 已移除 BigQueryBaseCursor.run_with_configuration()。請改用 BigQueryHook.insert_job()

    • 已移除 BigQueryBaseCursor.run_load()。請改用 BigQueryHook.insert_job()

    • 已移除 BigQueryBaseCursor.run_copy()。請改用 BigQueryHook.insert_job()

    • 已移除 BigQueryBaseCursor.run_extract()。請改用 BigQueryHook.insert_job()

    • 已移除 BigQueryBaseCursor.run_query()。請改用 BigQueryHook.insert_job()

  • 從 Google 提供程式中刪除已棄用的功能 (#43953)

功能

  • feat: 為 BigQueryToBigQueryOperator 新增 OpenLineage 支援 (#44214)

  • 引入 gcp 高階 API (V3) 轉換本機資料集運算子 (#44271)

  • 引入新的 gcp TranslateText 和 TranslateTextBatch 運算子 (#43860)

  • 將 gcloud 命令新增到 DataprocCreateClusterOperator,以便能夠在 GKE 叢集上建立 dataproc (#44185)

錯誤修復

  • 修復 'BigQueryAsyncHook.create_job_for_partition_get' 中的不正確查詢。(#44225)

  • 修復 Dataplex 資料質量的部分更新 (#44262)

其他

  • 將 'google-cloud-translate' 升級到 '3.16' (#44297)

  • 將 'google-cloud-datacatalog' 升級到 '3.23' (#44281)

  • 在整個程式碼庫中將 execution_date 重新命名為 logical_date (#43902)

10.26.0

功能

  • 為 CloudSQL 連線新增對 IAM 資料庫身份驗證的支援 (#43631)

  • 為 'GCSToBigQueryOperator' 提供 'force_delete' 選項 (#43785)

  • 統一 BigQuery 運算子中的 reattach_states 引數邏輯 (#43259)

錯誤修復

  • 從 ListCustomTrainingJobOperator 的 template_fields 中刪除不存在的欄位 (#43924)

  • 修復 'UploadModelOperator' 中驗證 'parent_model' 引數的問題 (#43473)

其他

  • 新增對 DbApiHook、PrestoHook 和 TrinoHook 的分號剝離支援 (#41916)

  • 刪除 Google 提供程式中 Airflow 2.1 相容程式碼 (#43952)

  • 解釋如何將 uv 與 airflow virtualenv 一起使用並使其工作 (#43604)

  • 將 python 運算子移動到 Standard 提供程式 (#42081)

  • 更新 Google ADS 的版本 (#43474)

10.25.0

功能

  • feat: 為 GCSHook 新增 Hook Level Lineage 支援 (#42507)

  • feat: 用於檢查 Dataform 操作狀態的感測器 (#43055)

  • 為 Google Cloud Vertex AI 上下文快取建立運算子 (#43008)

錯誤修復

  • 修復過時的 CloudRunExecuteJobOperator 文件 (#43195)

  • 修復 TestTranslationLegacyModelPredictLink dataset_id 錯誤 (#42463)

其他

  • dataproc 建立 批次 工作負載 新增 除錯 日誌 (#43265)

  • plyvel 新增 最小 版本 (#43129)

  • Vertex AI 訓練 operators: 渲染的 欄位 新增 display_name (#43028)

  • 使 google provider pyarrow 依賴 顯式化 (#42996)

  • 限制 looker-sdk 版本 24.18.0 microsoft-kiota-http 1.3.4 (#42954)

10.24.0

功能

  • DataprocCreateClusterOperator DataprocCreateBatchOperator 新增 'retry_if_resource_not_ready' 邏輯 (#42703)

Bug修復

  • 如果 提供了 batch_id,則在 Dataproc Serverless Batch 連結 啟動後 釋出 (#41153)

  • 修復 PubsubPullTrigger 中的 PubSubAsyncHook 使用 gcp_conn_id (#42671)

  • 修復 PubSubPullSensor 返回 一致的 響應 (#42080)

  • 拆分 完整的 BigQuery 名時,撤消 名中 排除 分割槽 (#42541)

  • 修復 gcp 文字轉語音 uri 獲取 (#42309)

  • 重構 ''GCSHook'' 中的 ''bucket.get_blob'' 呼叫 處理 不存在的 物件的驗證。 (#42474)

  • Bugfix/dataflow job location 傳遞 (#41887)

其他

  • 刪除 airflow 版本 2.8.0 以上版本中 任務 上下文 日誌記錄的 條件 檢查 (#42764)

  • 資料集 相關的 python 變數 名稱 重新命名 asset (#41348)

  • 棄用 AutoMLBatchPredictOperator 重構 AutoMl 系統 測試 (#42260)

10.23.0

功能

  • 新增 dataproc 叢集中 建立 Flink 作業的 能力 (#42342)

  • 新增 新的 Google Search 360 Reporting Operators (#42255)

  • return_immediately 作為 引數 新增到 PubSubPullSensor (#41842)

  • 'UploadModelOperator' 新增 parent_model 引數 (#42091)

  • 新增 DataflowStartYamlJobOperator (#41576)

  • Google Vertex AI Rapid Evaluation API 新增 RunEvaluationOperator (#41940)

  • Google Generative AI CountTokensAPI 新增 CountTokensOperator (#41908)

  • 新增 Supervised Fine Tuning Train Operator,Hook,Tests,Docs (#41807)

Bug修復

  • 進行小的修復 確保 成功的 Vertex AI LLMops pipeline (#41997)

  • BigQuery 名中 排除 分割槽 (#42130)

  • [修復 #41763]: 未指定 具有 預設值時,SFTPToGCSOperator 中的 冗餘 正斜槓 destination_path (#41928)

  • 修復 GKEJobTrigger 中的 poll_interval (#41712)

  • 更新 dataflow job id 提取的 模式 (#41794)

  • 強制執行 google provider 包的 EOL 棄用 訊息 格式 (#41637)

  • 修復 KubernetesJobOperator 'do_xcom_push' 'get_logs' 功能 (#40814)

其他

  • 標記 VertexAI AutoMLText 棄用 (#42251)

  • 排除 google-cloud-spanner 3.49.0 (#42011)

  • 刪除 已棄用的 Google analytics operators 系統 測試 (#41946)

  • 更新 google-cloud-bigquery 包的 最小 版本 (#41882)

  • 取消固定 Google provider google-cloud-bigquery 版本 (#41839)

  • 已棄用的 DAG.following_schedule() 方法 遷移 (#41773)

  • providers 刪除 已棄用的 soft_fail (#41710)

  • 更新 google-ads 的版本 (#41638)

  • 刪除 已棄用的 日誌 處理程式 引數 filename_template (#41552)

主要

警告

之前的 Search Ads 360 Reporting API <https://developers.google.com/search-ads/v2/how-tos/reporting> (當前在 google-provider 中使用)已於 2024 年 6 月 30 日停用(請參閱詳細資訊 <https://developers.google.com/search-ads/v2/migration>)。所有新的報告開發都應使用新的 Search Ads 360 Reporting API。目前,由於停用,報告 operators、感測器和 hooks 失敗。新的 API 不是舊 API 的替代品,它具有不同的方法和端點。因此,為新的 API 實現了新的 operators。

10.22.0

注意

Apache Airflow providers support policy 中所述,此 provider 版本僅適用於 Airflow 2.8+。

功能

  • 新增 'CloudRunServiceHook' 'CloudRunCreateServiceOperator' (#40008)

Bug修復

  • fix(providers/google): CloudDataTransferServiceAsyncHook 新增 缺失的 sync_hook_class (#41417)

其他

  • providers 中的 最小 Airflow 版本 提升 Airflow 2.8.0 (#41396)

  • 重構 'DataprocCreateBatchOperator' (#41527)

  • 升級 gcloud-aio-auth>=5.2.0 (#41262)

10.21.1

Bug修復

  • 修復 CloudSQL hook 的不必要的 匯入 (#41009)

  • 敏感資訊 移動到 系統 測試 google_analytics_admin 金鑰 管理器 (#40951)

  • 修復 自定義 訓練 作業 operators 接受 沒有 託管 模型 的結果 (#40685)

  • 修復 BigQueryInsertJobOperator reattach_state 引數的 行為 (#40664)

  • 修復 CloudSQLDatabaseHook 臨時 檔案 處理 (#41092)

其他

  • 重構 dataproc 系統 測試 (#40720)

  • openlineage: OpenLineage 提供程式 遷移到 V2 facet。 (#39530)

  • 解決 CloudSQLDatabaseHook 棄用 警告 (#40834)

  • 修復 BeamRunJavaPipelineOperator 在未設定 job_name 的情況下失敗 (#40645)

10.21.0

注意

修改 修復 'GCSToGCSOperator' 移動 單個 物件的行為差異 (#40162) 已被撤銷,因為它破壞了太多的現有工作流程。 GCSToGCSOperator 的行為已恢復到之前的行為。

功能

  • 更新 Google Cloud 生成式 模型 Hooks/Operators 以與 Vertex AI API 保持一致 (#40484)

  • DataflowStartFlexTemplateOperator。 每次檢查週期檢查 Dataflow 作業型別。 (#40584)

  • LocalFilesystemToGCSOperator 新增 chunk_size 引數 (#40379)

  • BigQueryCheckOperator 新增 查詢 引數的支援 (#40558)

  • DataprocCreateBatchOperator 中新增指向 dataproc 作業的連結按鈕 (#40643)

Bug 修復

  • 還原 "修復 'GCSToGCSOperator' 移動 單個 物件的行為差異 (#40162)" (#40577)

  • 修復 BigQueryInsertJobOperator 的返回值以及可延遲模式下的 openlineage 提取 (#40457)

  • 修復 GCP 可延遲運算子的 OpenLineage 提取 (#40521)

  • 修復 CloudBatchSubmitJobOperator 中對 project_id 的尊重 (#40560)

10.20.0

注意

現在,GCSToGCSOperator 在移動或複製單個物件時會保留巢狀的資料夾結構,使其行為與多個物件的行為保持一致。如果此更改影響您的工作流程,您可能需要調整您的 source_object 引數,以包括直到包含您的單個檔案的資料夾的完整路徑,並明確指定 destination_object 以忽略巢狀的資料夾。例如,如果您之前使用 source_object='folder/nested_folder/',要移動檔案 'folder/nested_folder/second_nested_folder/file',您現在應該使用 source_object='folder/nested_folder/second_nested_folder/' 並指定 destination_object='folder/nested_folder/'。這將把檔案移動到 'folder/nested_folder/file',而不是將其移動到 'folder/nested_folder/second_nested_folder/file' 的固定行為。

警告

上面的更改已在 10.21.0 版本中撤銷。 GCSToGCSOperator 的行為已恢復到之前的行為。

功能

  • google cloud multimodal model operators 新增 generation_config safety_settings (#40126)

  • 'BigQueryUpdateTableSchemaOperator' 新增缺少的 location 引數 (#40237)

  • Google Cloud Operators 新增對外部 IdP OIDC 令牌檢索的支援。 (#39873)

  • BigQuery operators 新增 encryption_configuration 引數 (#40063)

  • GoogleBaseAsyncHook 新增預設的 gcp_conn_id (#40080)

  • PubSubPublishMessageOperator GCP Operator 新增 排序 選項 (#39955)

  • GCSHook 中新增從 GCS blob 獲取元資料的方法 (#38398)

  • AutoMLHook 中的 create_auto_ml_forecasting_training_job 中新增 window 引數 (#39767)

  • 實現 CloudComposerDAGRunSensor (#40088)

  • 實現 'CloudDataTransferServiceRunJobOperator' (#39154)

  • 非同步獲取 GKEStartPod 的中間日誌 (#39348)

  • google provider 包中為 AzureBlobStorageToGCSOperator 新增 OpenLineage 支援 (#40290)

Bug 修復

  • 修復 hive_partition_sensor 系統 測試 (#40023)

  • 修復 openai 1.32 破壞 openai 測試 (#40110)

  • 修復 google auth mypy 版本顯示憑據初始化 (#40108)

  • 修復 DataflowHook 中排除雙引號和換行符的正則表示式 (#39991)

  • 修復 BigQueryToPostgresOperator 的替換引數 (#40278)

  • 修復 'GCSToGCSOperator' 移動 單個 物件的行為差異 (#40162)

其他

  • 重構 datapipeline operators (#39716)

  • 更新 Python 3.12 pandas 最低要求 (#40272)

  • 使用最低直接依賴關係解析實現每個提供程式的測試 (#39946)

  • openlineage: 在單獨的程序中執行提取和訊息傳送 (#40078)

  • google-auth 的最低版本提升到 2.29.0 (#40190)

  • 提升 google-ads 版本以預設使用 v17 (#40158)

  • google: openlineage 匯入移動到方法內部 (#40062)

  • DataplexGetDataQualityScanResultOperator 中新增 job_id 作為 template_field (#40041)

  • httpx >= 0.25.0 新增依賴項 (#40256)

10.19.0

注意

在 AutoML Natural Language、Tables、Vision 和 Video Intelligence 服務的舊版本關閉後,幾個 AutoML 運算子已停止支援。這包括 AutoMLDeployModelOperatorAutoMLTablesUpdateDatasetOperatorAutoMLTablesListTableSpecsOperatorAutoMLTablesListColumnSpecsOperator。請參閱運算子文件以瞭解可用的替代方案(如果有)。有關 AutoML 關閉的更多資訊,請參見

功能

  • GCP base hook 中引入匿名憑據 (#39695)

Bug 修復

  • 如果 parent_model 版本字尾傳遞給 Vertex AI operators,則刪除它 (#39640)

  • 如果缺少 location,則修復 BigQueryCursor execute 方法 (#39659)

  • 修復 PubSubPullSensor 可延遲模式 下的 已確認功能 (#39711)

  • AutoML Operator 連結 重定向 Google 翻譯 連結 (#39668)

  • google-cloud-bigquery 鎖定 < 3.21.0 (#39583)

其他

  • 移除 Google Snowflake Provider 中的 'openlineage.common' 依賴項 (#39614)

  • 棄用 AutoML Tables Operator (#39752)

  • 解決 Azure FileShare-to-GCS 測試 中的 棄用警告 (#39599)

  • 拼寫錯誤: spec 中錯誤的 OpenLineage facet key (#39782)

  • StackdriverTaskHandler 移除 陳舊程式碼 (#39744)

10.18.0

注意

Apache Airflow Provider支援策略中所述,此 Provider 版本僅適用於 Airflow 2.7+。

功能

  • Google LLM Operator 新增 模板化 欄位 (#39174)

  • 新增 邏輯 以處理 deferrable=True BigQueryInsertJobOperator on_kill (#38912)

  • 建立 'CloudComposerRunAirflowCLICommandOperator' Operator (#38965)

  • Dataflow Sensor 可延遲 模式 (#37693)

  • 自定義 訓練 Job Operator 可延遲 模式 (#38584)

  • CloudSQLExecuteQueryOperator 中對 SSL 支援的 增強 (#38894)

  • 建立 GKESuspendJobOperator GKEResumeJobOperator Operator (#38677)

  • Google Transfer Service Operator 中的 AWS 憑據 新增 role arn 的支援 (#38911)

  • encryption_configuration 引數 新增到 BigQueryCheckOperator BigQueryTableCheckOperator (#39432)

  • 'job_id' 引數 新增到 'BigQueryGetDataOperator' (#39315)

Bug修復

  • 修復 DataflowTemplatedJobStartOperator DataflowStartFlexTemplateOperator 可延遲模式 (#39018)

  • 修復 BigQueryToPostgresOperator 批次處理 (#39233)

  • 修復 任務 被標記為 失敗時 deferrable mode=True 下的 DataprocSubmitJobOperator (#39230)

  • 修復 GCSObjectExistenceSensor Operator 以在 可延遲 非可延遲 模式下返回相同的 XCOM (#39206)

  • 修復 conn_id BigQueryToMsSqlOperator (#39171)

  • 修復 Google 身份驗證 重新整理憑據 錯誤的情況下新增重試邏輯 (#38961)

  • 修復 可延遲模式下 BigQueryCheckOperator 跳過的 錯誤檢查 (#38408)

  • 修復 GCSDeleteObjectsOperator 中使用 字首 而不是所有檔案路徑來表示 OpenLineage 資料集 (#39059)

  • 修復 GCSToGCSOperator 中使用 字首 而不是完整檔案路徑來表示 OpenLineage 資料集 (#39058)

  • 修復 GCSTimeSpanFileTransformOperator 中的 OpenLineage 資料集 (#39064)

  • 修復 'DataprocSubmitPySparkJobOperator' 臨時 檔名生成 (#39498)

  • 修復 TaskInstance 未處於 running deferred 狀態時 DataprocSubmitJobOperator 取消外部 Job 的邏輯 (#39447)

  • 修復 TaskInstance 未處於 running deferred 狀態時 BigQueryInsertJobOperator 取消外部 Job 的邏輯 (#39442)

  • 修復 TaskInstance 未處於 running deferred 狀態時 DataprocCreateClusterOperator 取消外部 Job 的邏輯 (#39446)

  • 修復 使用 'result_retry' 'DataprocCreateBatchOperator' 引發 'AttributeError' (#39462)

  • 修復 GKEStartKueueInsideClusterOperator YAML 解析 (#39234)

  • 修復 BigQueryInsertJobOperator 中標籤值的驗證 (#39568)

其他

  • Provider 中的 最低 Airflow 版本 提升到 Airflow 2.7.0 (#39240)

  • 改進 'DataprocCreateClusterOperator' Trigger以實現更好的錯誤處理和資源清理 (#39130)

  • Microsoft Azure Provider 中新增 MSGraphOperator (#38111)

  • Google Provider 中應用 PROVIDE_PROJECT_ID mypy 解決方法 (#39129)

  • 處理 KubernetesDeleteJobOperator 匯入 (#39036)

  • 移除 Airflow 2.6 向後相容程式碼 (#39558)

  • 重新應用 所有 Provider 的模板 (#39554)

  • 更快地 匯入 'airflow_version' (#39552)

  • 已棄用的 新增 棄用警告並引發異常 (#38673)

  • 簡化 'airflow_version' 匯入 (#39497)

  • 斷開 GKE Operator 與已棄用 Hook 的連線 (#39434)

10.17.0

功能

  • 'impersonation_scopes' 新增到 BigQuery (#38169)

  • 可延遲模式 新增到 RunPipelineJobOperator (#37969)

  • 新增 GKECreateCustomResourceOperator GKEDeleteCustomResourceOperator Operator (#37616)

  • 為 Google Cloud Generative AI 使用新增 VertexAI 語言模型和多模態模型運算子 (#37721)

  • 新增 GKEListJobsOperator 和 GKEDescribeJobOperator (#37598)

  • 建立 GKEStartKueueJobOperator 運算子 (#37477)

  • 建立 DeleteKubernetesJobOperator 和 GKEDeleteJobOperator 運算子 (#37793)

  • 更新 GCS hook 以獲取 CMEK 保護物件的 crc32c 雜湊 (#38191)

  • 為 BigQuery 作業設定作業標籤以進行可追溯性 (#37736)

  • CreateBatchPredictionJobOperator 的可延期模式 (#37818)

Bug 修復

  • 修復 BigQuery 連線並新增文件 (#38430)

  • fix(google,log): 避免日誌名稱覆蓋 (#38071)

  • 修復 S3ToGCSOperator 觸發器的憑據錯誤 (#37518)

  • 修復 GCP Vertex AI AutoML 和自定義作業運算子中的 'parent_model' 引數 (#38417)

  • fix(google): 新增 return 語句以在觸發器中的 while 迴圈內生成 (#38394)

  • 修復 'PostgresToGCSOperator' 中游標唯一名稱超出 Postgres 識別符號限制的問題 (#38040)

  • 修復 gcs 匿名使用者問題,因為無 token (#38102)

  • 修復 BigQueryTablePartitionExistenceTrigger 分割槽查詢 (#37655)

其他

  • 新增 google-cloud-bigquery 作為顯式的 google-provider 依賴項 (#38753)

  • 避免在 'google' provider 的類方法中使用 'functools.lru_cache' (#38652)

  • 重構 GKE hooks (#38404)

  • 從 airflow 包中刪除未使用的迴圈變數 (#38308)

  • cloud_storage_transfer_service 的模板化欄位邏輯檢查 (#37519)

  • 重新命名 mlengine 運算子的欄位名稱以符合模板化欄位驗證 (#38053)

  • 重新命名 Vertex AI AutoML 運算子的欄位名稱以符合模板化欄位驗證 (#38049)

  • 重新命名 'DeleteCustomTrainingJobOperator' 的欄位名稱以符合模板化欄位驗證 (#38048)

  • 恢復從 Google Cloud 檢索的 Google Transfer 運算子的 delegate_to (#37925)

  • 重構 CreateHyperparameterTuningJobOperator (#37938)

  • 升級 google-ads 版本 (#37787)

10.16.0

特性

  • 'CloudRunExecuteJobOperator': 新增 project_id 到 hook.get_job 呼叫 (#37201)

  • 新增開發者 token 作為 GoogleAdsHook 的身份驗證方法 (#37417)

  • 新增 GKEStartKueueInsideClusterOperator (#37072)

  • 為 BigQueryInsertJobTrigger 新增可選的 'location' 引數 (#37282)

  • feat(GKEPodAsyncHook): 使用非同步憑據 token 實現 (#37486)

  • 建立 GKEStartJobOperator 和 KubernetesJobOperator (#36847)

Bug 修復

  • 修復 'DataFusionPipelineLinkHelper' 的無效棄用 (#37755)

  • 修復模板化欄位賦值 'google/cloud/operators/compute.py' (#37659)

  • 修復 bq_to_mysql 初始化檢查 (#37653)

  • 修復 Async GCSObjectsWithPrefixExistenceSensor xcom push (#37634)

  • 修復 GCSSynchronizeBucketsOperator 超時錯誤 (#37237)

  • fix: insert_rows 的簽名與超型別 DbApiHook 不相容 (#37391)

  • 在 _CredentialsToken 中使用 offset-naive datetime (#37539)

  • 在 DataprocInstantiateInlineWorkflowTemplateOperator 中使用 wait_for_operation (#37145)

其他

  • 修復 DataflowStartFlexTemplateOperator 文件中的拼寫錯誤 (#37595)

  • 僅在 'DbApiHook.insert_rows' 中將 'executemany' 關鍵字引數設為僅關鍵字引數 (#37840)

  • 統一 'aws_conn_id' 型別,始終為 'str | None' (#37768)

  • 限制 'pandas' 到 '<2.2' (#37748)

  • 移除 Google provider 運算子中損壞的已棄用回退 (#37740)

  • 實現 AIP-60 資料集 URI 格式 (#37005)

  • 解決 'bigquery' 的模板欄位初始化檢查 (#37586)

  • 更新 DataprocCreateBatchOperator 的文件 (#37562)

  • 替換 providers 中 'datetime.utcnow' 和 'datetime.utcfromtimestamp' 的用法 (#37138)

10.15.0

特性

  • 新增 service_file 支援到 GKEPodAsyncHook (#37081)

  • 更新 GCP Dataproc ClusterGenerator 以支援 GPU 引數 (#37036)

  • 建立 DataprocStartClusterOperator 和 DataprocStopClusterOperator (#36996)

  • 為 CreateHyperparameterTuningJobOperator 實現可延期模式 (#36594)

  • 為 GKEPodHook 啟用 '_enable_tcp_keepalive' 功能 (#36999)

Bug 修復

  • fix(providers/google): 修復 GKEPodAsyncHook.service_file_as_context 的使用方式 (#37306)

  • 修復 ComputeEngineSSHHook 的元資料覆蓋 (#37192)

  • 修復 '__init__' 中 'custom_job' 中模板欄位的賦值 (#36789)

  • 修復 DataflowTemplatedJobStartOperator 中的 location 要求 (#37069)

  • 修復 'CloudDataTransferServiceCreateJobOperator' '__init__' template 欄位 賦值 (#36909)

  • 修復了 GCP Data Fusion 連結的 硬編碼 預設 namespace 值。 (#35379)

  • 如果在 Dataproc 叢集 配置中 internal_ip_only 設定為 false, 則不要 忽略 (#37014)

其他

  • 恢復 針對 google-core-api 向後相容性 問題的 保護 (#37111)

  • 特性: 將所有 類、 函式、 方法 棄用 切換到 裝飾器 (#36876)

10.14.0

注意

BaseSQLToGCSOperator 中的 parquet_row_group_size 的預設值已從 1 更改為 100000,以便擁有一個預設值,該預設值提供更好的壓縮效率和讀取輸出 Parquet 檔案的資料的效能。在許多情況下,先前的值 1 導致非常大的檔案、長時間的任務持續時間和記憶體不足的問題。預設值 100000 可能需要更多記憶體來執行運算子,在這種情況下,使用者可以覆蓋運算子中的 parquet_row_group_size 引數。當 export_formatparquet 時,所有派生自 BaseSQLToGCSOperator 的運算子都會受到影響:MySQLToGCSOperatorPrestoToGCSOperatorOracleToGCSOperatorTrinoToGCSOperatorMSSQLToGCSOperatorPostgresToGCSOperator。鑑於以上情況,我們將此更改視為錯誤修復。

功能

  • templated 欄位 新增到 來自 'BigQueryToPostgresOperator' 'BigQueryToSqlBaseOperator' (#36663)

  • 添加了 檢查 取消 工作流 呼叫 並添加了 新的 查詢 工作流 呼叫 運算子 (#36351)

  • 實現 Google Analytics Admin (GA4) 運算子 (#36276)

  • 新增 運算子 診斷 叢集 (#36899)

  • scopes 新增到 GCP token (#36974)

  • 特性: gcloud-aio 客戶端中 完全 支援 google 憑據 (#36849)

錯誤修復

  • 修復 templated 欄位 super 建構函式 (#36934)

  • 修復: GKEStartPodOperator 尊重 連線 ID 模擬 (#36861)

  • 修復 warnings.warn stacklevel providers (#36831)

  • 修復 GCP Dataproc 連結中 棄用 (#36834)

  • 修復 建構函式中 templated 欄位 賦值 (#36603)

  • Dataproc 運算子 推遲 觸發器 之前 檢查 叢集 狀態 (#36892)

  • 防止 運算子 __init__ templated 欄位 邏輯 檢查 (#36489)

  • 直接 透過 BigQuery 載入 API 保留 ASCII 控制 字元 (#36533)

  • 更改 'BaseSQLToGCSOperator' 中的 預設 'parquet_row_group_size' (#36817)

  • 修復 google 運算子 處理 模擬 的問題 (#36903)

其他

  • 樣式(providers/google): 改進 BigQueryInsertJobOperator 型別 提示 (#36894)

  • 棄用 用於 視覺和影片的 AutoMLTrainModelOperator (#36473)

  • 刪除 KubernetesPodOperator 模組的 向後相容性 檢查 (#36724)

  • 刪除 KubernetesPodTrigger 模組的 向後相容性 檢查 (#36721)

  • 所有 providers airflow 最小 pandas 依賴項 設定為 1.2.5 (#36698)

  • 刪除 不必要的 templated 欄位 (#36491)

  • 文件(providers/google): 文件字串中將 GoogleBaseHookAsync 改寫為 GoogleBaseAsyncHook (#36946)

10.13.1

其他

  • 刪除 stackdriver 向後相容 程式碼 (#36442)

  • 刪除 未使用的 '_parse_version' 函式 (#36450)

  • GCS 任務 處理程式中 刪除 剩餘的 Airflow 2.5 向後相容 程式碼 (#36443) (#36457)

10.13.0

注意

此 provider 版本僅適用於 Airflow 2.6+,如 Apache Airflow providers 支援策略中所述。

功能

  • GCP Secrets 後端 模擬 (#36072)

  • GcsOperators 新增 OpenLineage 支援 - 刪除、 轉換 TimeSpanTransform (#35838)

  • 新增 使用 computeEngineSSHHook (google provider) IAP 隧道 進行 服務帳戶 模擬的 支援 (#35136)

  • 新增 Datascan 分析 (#35696)

  • Google Cloud Run 作業 執行 運算子的 模板 欄位新增 覆蓋 (#36133)

  • BeamRunJavaPipelineOperator 實現 可延期 模式 (#36122)

  • 新增 在非 可延期 模式下為 BeamRunPythonPipelineOperator 執行 流式 作業的 能力 (#36108)

  • use_glob 新增到 GCSObjectExistenceSensor (#34137)

錯誤修復

  • 修復 DataprocSubmitJobOperator 以檢索 失敗 作業 錯誤 訊息 (#36053)

  • 修復 CloudRunExecuteJobOperator 無法在 可延期 模式下檢索 Cloud Run 作業 狀態 (#36012)

  • 修復 gcs 列表 - 確保 blobs 已載入 (#34919)

  • 允許 模擬 鏈中的 多個 元素 (#35694)

  • Google Dataflow 客戶端的 重試 型別更改為 非同步 重試 (#36141)

  • DataprocCreateClusterOperator 運算子文件的 小幅修復。 (#36322)

  • 修復(bigquery.py): 將正確的 project_id 傳遞給 觸發器 (#35200)

  • 在檢查 字首之前 迭代 blobs (#36202)

  • 修復 google-cloud-monitoring 2.18.0 的不相容性 (#36200)
    • 更新 PubSubAsyncHook 中的 'retry' 引數 型別 (#36198)

其他

  • 將 providers 中的最低 Airflow 版本提升至 Airflow 2.6.0 (#36017)

  • 棄用 'CloudComposerEnvironmentSensor',推薦使用帶有 defer 模式的 'CloudComposerCreateEnvironmentOperator' (#35775)

  • 在子類中遵循 BaseHook 連線欄位方法簽名 (#36086)

  • 允許傳遞儲存選項 (#35820)

  • 新增從原始碼構建 "chicken-egg" 包的功能 (#35890)

  • 從 Google Provider 中移除剩餘的 Airflow 2.5 向後相容程式碼 (#36366)

  • 將 KubernetesPodTrigger hook 移動到快取屬性 (#36290)

  • 透過 Ruff 在文件字串中新增程式碼片段格式 (#36262)

10.12.0

功能

  • 為 schema_settings 和 message_retention_duration 添加了主題引數。 (#35767)

  • 新增對 GCSToBigQueryOperator 的 OpenLineage 支援 (#35778)

  • 新增對 BigQueryToGCSOperator 的 OpenLineage 支援 (#35660)

  • 為 Dataproc 新增對驅動程式池、例項靈活性策略和 min_num_instances 的支援 (#34172)

  • 為 Dataproc worker 新增 "NON_PREEMPTIBLE" 作為有效的搶佔型別 (#35669)

  • 新增將 impersonation_chain 傳遞給 BigQuery 觸發器的能力 (#35629)

  • 在 GoogleDisplayVideo360CreateQueryOperator 中為本地檔案新增過濾器 (#35635)

  • 擴充套件使用 GCP GCS 的遠端日誌記錄的任務上下文日誌記錄支援 (#32970)

Bug 修復

  • 修復並重新應用 provider 文件的模板 (#35686)

  • 修復檢查 dataflow 作業狀態的邏輯 (#34785)

其他

  • 從 BigQueryToBigQueryOperator 中移除對已棄用方法的使用 (#35605)

  • 在父類而不是 TaskContextLogger set_context 中檢查 attr (#35780)

  • 移除 providers 中與 Airflow 2.3/2.4 的向後相容 (#35727)

  • 在 GoogleDiscoveryApiHook 中恢復 delegate_to 引數 (#35728)

  • 移除對 BigQueryCursor 中已棄用方法的使用 (#35606)

  • 對齊 'MSSQLToGCSOperator' 的文件 (#35715)

10.11.1

其他

  • 將 Google Ads API 版本從 v14 更新到 v15 (#35295)

10.11.0

功能

  • AIP-58:新增 Airflow 物件儲存 (AFS) (#34729)

  • 改進 Dataprep hook (#34880)

其他

  • 將 'overrides' 引數新增到 CloudRunExecuteJobOperator (#34874)

10.10.1

其他

  • 新增與 Google Cloud Storage 相關的文件之間的連結 (#34994)

  • 將 AI Platform Prediction 的舊版本遷移到 VertexAI (#34922)

  • 在 DataprocInstantiate{Inline}WorkflowTemplateOperator 的 on_kill 中取消工作流 (#34957)

10.10.0

注意

Apache Airflow providers 支援策略中所述,此 provider 版本僅適用於 Airflow 2.5+。

功能

  • 改進:在 BigQueryIntervalCheckOperator 中引入 project_id (#34573)

Bug 修復

  • 在為 google sensors 引發異常時遵守 soft_fail 引數 (#34501)

  • 修復 GCSToGoogleDriveOperator 和 gdrive 系統測試 (#34545)

  • 修復 LookerHook 序列化缺少 1 個引數錯誤 (#34678)

  • 修復 Dataform 系統測試 (#34329)

其他

  • 提升 providers 的最低 airflow 版本 (#34728)

  • 重構 DataFusionInstanceLink 用法 (#34514)

  • 在 Google Provider 示例中使用 'airflow.models.dag.DAG' (#34614)

  • 棄用 Life Sciences Operator 和 Hook (#34549)

  • 在 providers 中使用 'airflow.exceptions.AirflowException' (#34511)

10.9.0

功能

  • 為 CloudDataFusionStartPipelineOperator 新增對流(即時)管道的顯式支援 (#34271)

  • 將 'expected_terminal_state' 引數新增到 Dataflow operators (#34217)

Bug 修復

  • 修復:當在 body 引數中給出時,'ComputeEngineInsertInstanceOperator' 不遵守 jinja 模板化的例項名稱 (#34171)

  • 修復:BigQuery 作業錯誤訊息 (#34208)

  • GKEPodHook 忽略 gcp_conn_id 引數。 (#34194)

其他

  • 提升 Google provider min common-sql provider 版本 (#34257)

  • 移除 字典上不必要的 keys() 方法呼叫 (#34260)

  • 重構: providers 中積極思考 (#34279)

  • 重構: 簡化 providers/google 中的程式碼 (#33229)

  • 重構: 簡化比較 (#34181)

  • 棄用 NL AutoMLTrainModelOperator (#34212)

  • 簡化為 bool(...) (#34258)

  • 使 Google Dataform operators templated_fields 更加一致 (#34187)

10.8.0

特性

  • Dataplex DataQuality 新增 deferrable 模式。 (#33954)

  • 允許在 Google Cloud 連線上設定 impersonation_chain (#33715)

Bug 修復

  • fix(providers/google-marketing-platform): 當引發異常時,尊重 soft_fail 引數 (#34165)

  • fix: endpoint_service.py 中的文件字串 (#34135)

  • 修復 BigQueryValueCheckOperator deferrable 模式最佳化 (#34018)

  • Datafusion pipelines artifact 版本動態設定 (#34068)

  • 如果 Dataproc 叢集以 ERROR 狀態啟動,則儘早刪除它。 (#33668)

  • 當使用 DataFusionAsyncHook 時,透過將 sleep 替換為 asyncio.sleep 來避免阻塞事件迴圈 (#33756)

其他

  • 整合 os.path.* 的匯入 (#34060)

  • 重構 providers 中的正則表示式 (#33898)

  • Google provider 中,如果可能,將 try 移到迴圈外部 (#33976)

  • 合併 providers 中類似的 if 邏輯 (#33987)

  • providers 中刪除無用的字串連線 (#33968)

  • 更新 Azure fileshare hook 以使用 azure-storage-file-share 而不是 azure-storage-file (#33904)

  • 重構 providers 中不需要的跳轉 (#33833)

  • 當在 providers 中尋找正值時,用 any 替換迴圈 (#33984)

  • providers 中,用 contextlib.suppress 替換 try - except pass (#33980)

  • providers 程式碼中刪除一些無用的 try/except (#33967)

  • Airflow providers 中,用解包替換序列連線 (#33933)

  • 'BigQueryHook.get_pandas_df' 中刪除一個已棄用的選項 (#33819)

  • providers 中,用 dict() 替換不必要的字典推導式 (#33857)

  • 透過將其中一些移到型別檢查塊中,改進 google provider 中的模組匯入 (#33783)

  • providers 中,使用帶有多個上下文的單個語句,而不是巢狀語句 (#33768)

  • providers 中,使用字面量字典而不是呼叫 dict() (#33761)

  • 刪除不必要的,並使用 providers 中的列表重寫它 (#33763)

  • 重構: 簡化一些迴圈 (#33736)

  • E731: Airflow providers 中,用 def 方法替換 lambda (#33757)

  • Airflow providers 中使用 f-string (#33752)

10.7.0

特性

  • 新增 CloudRunHook operators (#33067)

  • 新增 'CloudBatchHook' operators (#32606)

  • 新增對 Google Cloud Data Pipelines Run Operator 的支援 (#32846)

  • 將引數 sftp_prefetch 新增到 SFTPToGCSOperator (#33274)

  • 新增 Google Cloud Data Pipelines Create Operator (#32843)

  • 新增 Dataplex Data Quality operators。 (#32256)

Bug 修復

  • 修復了當使用不同於 CSV 的格式時 BigQueryCreateExternalTableOperator 的問題 (#33540)

  • 修復 DataplexDataQualityJobStatusSensor 並新增單元測試 (#33440)

  • 避免在執行時和模組級別匯入 pandas numpy (#33483)

其他

  • 將缺少的模板欄位新增到 DataformCreateCompilationResultOperator (#33585)

  • 整合 pandas 的匯入和使用 (#33480)

  • datetime 匯入 utc 並規範化其匯入 (#33450)

10.6.0

特性

  • openlineage, bigquery: BigQueryExecuteQueryOperator 新增 openlineage 方法支援 (#31293)

  • GCS Requester Pays bucket 支援新增到 GCSToS3Operator (#32760)

  • CloudDataTransferServiceGCSToGCSOperator 新增系統測試和文件 (#32960)

  • 為SQL運算子新增一個新引數,以指定conn id欄位(#30784)

Bug 修復

  • 修復 'DataFusionAsyncHook' 捕獲 404 錯誤 (#32855)

  • 修復 MetastoreHivePartitionSensor 的系統測試 (#32861)

  • 修復捕獲 409 錯誤 (#33173)

  • 使 'sql' 成為 'BigQueryInsertJobOperator' 中的快取屬性 (#33218)

其他

  • refactor(providers.google): 對 DATAPROC_JOB_LOG_LINK 使用模組級別的 __getattr__ 到 DATAPROC_JOB_LINK 並新增棄用警告 (#33189)

10.5.0

新特性

  • openlineage, gcs: 為 GcsToGcsOperator 新增 openlineage 方法 (#31350)

  • 使用 Dataproc Operators 新增 Spot 例項支援 (#31644)

  • 將 sqlalchemy-spanner 包安裝到 Google provider 中 (#31925)

  • 過濾和排序 DataprocListBatchesOperator 的結果 (#32500)

Bug 修復

  • 修復 BigQueryGetDataOperator 在 deferrable 模式下不遵守 project_id 的問題 (#32488)

  • 重新整理 GKE OAuth2 令牌 (#32673)

  • 修復 'BigQueryInsertJobOperator' 沒有退出 deferred 狀態 (#31591)

其他

  • 修復已棄用的 DataprocSubmitSparkJobOperator 的文件字串,並重構系統測試 (#32743)

  • 為 DbApiHook.run 方法新增更準確的型別提示 (#31846)

  • 將棄用資訊新增到 providers 模組和類的文件字串中 (#32536)

  • 修復已棄用的 DataprocSubmitHiveJobOperator 的文件字串 (#32723)

  • 修復已棄用的 DataprocSubmitPigJobOperator 的文件字串 (#32739)

  • 修復 Datafusion 系統測試 (#32749)

10.4.0

新特性

  • 為 S3ToGCSOperator 實現 deferrable 模式 (#29462)

Bug 修復

  • 當複製檔案到沒有萬用字元的資料夾時,修復 GCSToGCSOperator (#32486)

  • 修復 'GCSHook' 中 upload 函式的 'cache_control' 引數 (#32440)

  • 修復 BigQuery transfer operators 以遵守 project_id 引數 (#32232)

  • 修復在空列表上 gcp_gcs_delete_objects 的問題 (#32383)

  • 修復 cloud_build 中 defer 的無限迴圈問題 (#32387)

  • 修復 GCSToGCSOperator 在沒有萬用字元且 exact_match=True 的情況下的複製問題 (#32376)

其他

  • 允許提供目標資料夾 (#31885)

  • 將 'AzureBlobStorageToGCSOperator' 從 Azure 移動到 Google provider (#32306)

  • 在 BigQueryInsertJobOperator 中提供更好的 job configuration docs 連結 (#31736)

10.3.0

新特性

  • 將 'on_finish_action' 新增到 'KubernetesPodOperator' (#30718)

  • 將 deferrable 模式新增到 CloudSQLExportInstanceOperator (#30852)

  • 將 'src_fmt_configs' 新增到模板欄位列表中 (#32097)

Bug 修復

  • [Issue-32069] 修復批次請求中的名稱格式 (#32070)

  • 修復 'BigQueryInsertJobOperator' 在 deferrable 模式下的錯誤處理 (#32034)

  • 修復 'BigQueryConsoleLink' 中的 'BIGQUERY_JOB_DETAILS_LINK_FMT' (#31953)

  • 使 DataprocCreateBatchOperator 的 deferrable 版本能夠處理已存在的 batch_id (#32216)

其他

  • 將 Google Ads API 版本從 v13 切換到 v14 (#32028)

  • 棄用 GCS 中的 'delimiter' 引數和源物件的萬用字元,引入 'match_glob' 引數 (#31261)

  • 重構 GKECreateClusterOperator 的 body 驗證 (#31923)

  • 最佳化 'BigQueryValueCheckOperator' 的 deferrable 模式執行 (#31872)

  • 新增 default_deferrable 配置 (#31712)

10.2.0

注意

此版本放棄了對 Python 3.7 的支援

新特性

  • 在迴圈中生成事件時新增 return 以停止執行 (#31985)

  • 將 deferrable 模式新增到 PubsubPullSensor (#31284)

  • 新增一個新引數,以在 'BaseSQLToGCSOperator' 中設定 parquet 行組大小 (#31831)

  • 將 'cacheControl' 欄位新增到 google cloud storage (#31338)

  • 將 'preserveAsciiControlCharacters' 新增到 'src_fmt_configs' (#31643)

  • 將 credential configuation 檔案身份驗證支援新增到 Google Secrets Manager secrets 後端 (#31597)

  • 將 credential configuration 檔案支援新增到 Google Cloud Hook (#31548)

  • 將 deferrable 模式新增到 'GCSUploadSessionCompleteSensor' (#31081)

  • 在 DataflowStartFlexTemplateOperator 中新增 append_job_name 引數 (#31511)

  • FIPS 環境:將 md5 的使用標記為“不用於安全目的” (#31171)

  • 實現 MetastoreHivePartitionSensor (#31016)

Bug 修復

  • Bigquery: 修復已存在的表和資料集的連結 (#31589)

  • 為 TabularDataset 提供缺少的 project id 和 creds (#31991)

其他

  • 最佳化 'DataprocSubmitJobOperator' 的 deferrable 模式執行 (#31317)

  • 最佳化 可延期模式 執行 ,針對 'BigQueryInsertJobOperator' (#31249)

  • 移除 yield from triggers 後的 return 語句 (#31703)

  • 標準 csv 替換 unicodecsv (#31693)

  • 最佳化 可延期模式 (#31758)

  • 移除 Python 3.7 支援 (#30963)

10.1.1

Bug修復

  • 修復 透過 私有 端點 'GKEStartPodOperator' 訪問 GKE 叢集 的問題 (#31391)

  • 修復 'BigQueryGetDataOperator' 可延期模式 下的 查詢 作業 錯誤 (#31433)

10.1.0

注意

正如 Apache Airflow providers 支援策略中所述,此 provider 版本僅適用於 Airflow 2.4+。

注意

此版本將預設的 Google Ads 更新為 v13。由於 Google 已棄用 v12 並且即將刪除它,因此我們不認為這是 Airflow 中的一項重大更改。

注意

此版本的 provider 更新了許多 Google 包。請檢視包更改日誌

特性

  • 新增 可延期模式 DataprocInstantiateInlineWorkflowTemplateOperator (#30878)

  • 新增 可延期模式 'GCSObjectUpdateSensor' (#30579)

  • 新增 協議 定義 KubernetesPodOperator 依賴的 方法 (#31298)

  • 新增 BigQueryToPostgresOperator (#30658)

Bug修復

  • 'DataflowTemplatedJobStartOperator' 修復了 提供了 區域時, 預設值 覆蓋 location 的問題。 (#31082)

  • GCSObjectsWithPrefixExistenceSensor 延期 之前 輪詢 一次 (#30939)

  • 新增 可延期模式 'GCSObjectsWithPrefixExistenceSensor' (#30618)

  • 允許 gcs 刪除/列表 hooks operators 中使用 多個 字首 (#30815)

  • 修復 可延期 GCS 感測器中 刪除的 delegate_to 引數 (#30810)

其他

  • 新增 'use_legacy_sql' 引數 'BigQueryGetDataOperator' (#31190)

  • 新增 'as_dict' 引數 'BigQueryGetDataOperator' (#30887)

  • 新增 標記 apply_gcs_prefix S3ToGCSOperator (b/245077385) (#31127)

  • 新增 'priority' 引數 BigQueryHook (#30655)

  • 提升 providers 中的 最低 Airflow 版本 (#30917)

  • BigQueryCreateExternalTableOperator 實現 gcs_schema_object (#30961)

  • 最佳化 延遲 執行 模式 (#30946)

  • 最佳化 可延期模式 執行 (#30920)

  • 最佳化 'GCSObjectExistenceSensor' 中的 可延期模式 (#30901)

  • 'CreateBatchPredictionJobOperator' Vertex AI BatchPredictionJob 物件 新增 batch_size 引數 (#31118)

  • GKEPodHook 需要 具有 KPO 呼叫的 所有 方法 (#31266)

  • 新增 CloudBuild 構建 id 日誌 (#30516)

  • 預設 Google ads 切換到 v13 (#31382)

  • 切換到 google ads v13 (#31369)

  • 更新 google provider 包的 SDK (#30067)

10.0.0

重大更改

Google 宣佈將於 2023 年 4 月 20 日停止 Campaign Manager 360 v3.5。有關更多資訊,請檢視:https://developers.google.com/doubleclick-advertisers/deprecation 。因此,Campaign Manager 360 operator 的預設 api 版本已更新為最新的 v4 版本。

警告

在此版本的 provider 中,已從所有 GCP operators、hooks 和 triggers 中刪除已棄用的 delegate_to 引數,以及與 GCS 互動的 firestore 和 gsuite transfer operators。可以透過使用 impersonation_chain 引數來實現模擬。delegate_to 引數仍僅在 gsuite 和 marketing platform hooks 和 operators 中可用,它們不與 Google Cloud 互動。

  • GCP operators hooks 移除 delegate_to (#30748)

  • 更新 Google Campaign Manager360 operators 以使用 API v4 (#30598)

Bug修復

  • 更新 DataprocCreateCluster operator 以正確使用 'label' 引數 (#30741)

其他

  • BigQueryGetDataOperator 新增 缺失的 project_id (#30651)

  • 展示 Video 360 清理 v1 API 用法 (#30577)

9.0.0

重大更改

Google 宣佈將於 2023 年 4 月 27 日停止 Bid manager API v1 和 v1.1,有關更多資訊,請檢視:docs 因此,GoogleDisplayVideo360Hook 和相關 operators 中的 api_version 預設值已更新為 v2

此版本的 provider 包含一個臨時解決方法,用於解決 google-ads API 的 v11 版本已停止使用的問題,而 google provider 依賴項阻止安裝任何支援 v12 API 的 google-ads 客戶端。此版本包含 google-ads 庫的內建版本 20.0.0,僅支援 v12。一旦 provider 的依賴項允許使用支援更新版本的 google-ads API 的 google-ads,此解決方法(和內建庫)將被刪除。

注意

僅支援 google ads 的 v12 版本。建立 operator 或客戶端時,應設定 v12。

  • 更新 DV360 operators 以使用 API v2 (#30326)

  • 修復 google ads 內建庫中的 動態 匯入 (#30544)

  • 修復 vendored-in google ads 所需的 另一個 動態 匯入 (#30564)

特性

  • 新增 可延期模式 GKEStartPodOperator (#29266)

Bug修復

  • BigQueryHook list_rows/get_datasets_list 可以返回 迭代器 (#30543)

  • 修復 構建 非同步 憑據 (#30441)

8.12.0

特性

  • Bigquery operator 新增 缺失的 'poll_interval' (#30132)

  • BigQueryInsertJobOperator 中新增 poll_interval 引數 (#30091)

  • 新增 'job_id' 'BigQueryToGCSOperator' templated_fields (#30006)

  • 支援 使用 遠端 日誌記錄 刪除 本地 日誌 檔案 (#29772)

Bug 修復

  • 修復 設定 gs bq bq gs project_id (#30053)

  • 修復 雲構建 運算子上的 location (#29937)

  • 'GoogleDriveHook': 修復 日誌 訊息 + 新增 更詳細的 文件 (#29694)

  • "BOOLEAN" 新增到 MSSQLToGCSOperator type_map修復 不正確的 bit->int 型別 轉換,透過 顯式指定 BIT 欄位 (#29902)

  • Google Cloud Providers - 修復 _MethodDefault deepcopy 失敗 (#29518)

  • 處理 非同步 BigQuery dts 觸發器上的 專案 location 引數 (#29786)

  • 支援 CloudDataTransferServiceJobStatusSensor 而不指定 project_id (#30035)

  • 正常 模式下 等待 insert_job 結果 (#29925)

其他

  • BigQueryTableExistenceAsyncSensor 合併到 BigQueryTableExistenceSensor (#30235)

  • google provider 中刪除 不必要的 上限 約束 (#29915)

  • BigQueryTableExistencePartitionAsyncSensor 合併到 BigQueryTableExistencePartitionSensor (#30231)

  • GCSObjectExistenceAsyncSensor 邏輯 合併到 GCSObjectExistenceSensor (#30014)

  • cncf provider 檔名 AIP-21 對齊 (#29905)

  • 切換到 使用 供應商提供的 google ads。 (#30410)

  • 合併 google ads 供應商提供的 程式碼。 (#30399)

8.11.0

特性

  • BigQueryTablePartitionExistenceSensor 新增 可延期 模式。 (#29735)

  • BigQuery 運算子新增 一個 引數,以 支援 資源 存在時的 其他 操作 (#29394)

  • DataprocInstantiateWorkflowTemplateOperator 新增 可延期 模式 (#28618)

  • Dataproc 批處理 (#29136)

  • 新增 'CloudSQLCloneInstanceOperator' (#29726)

Bug 修復

  • 修復 'NoneType' 物件 不可下標。 (#29820)

  • 修復 增強 'check-for-inclusive-language' CI 檢查 (#29549)

  • 不要 BigQueryCreateDataTransferOperator XCOM 中推送 secret (#29348)

其他

  • Google Cloud Providers - 引入 GoogleCloudBaseOperator (#29680)

  • 更新 google cloud dlp 包,並調整 hook operators (#29234)

  • 重構 Dataproc 觸發器 (#29364)

  • 刪除 google-cloud-bigtable 上的 <2.0.0 限制 (#29644)

  • 幫助 訊息 移動到 google auth 程式碼 (#29888)

8.10.0

特性

  • GKECreateClusterOperator GKEDeleteClusterOperator 新增 延遲 模式 (#28406)

Bug 修復

  • cloud_sql_binary_path connection 移動到 Hook (#29499)

  • 檢查 cloud sql provider 版本是否有效 (#29497)

  • 'GoogleDriveHook': upload_file 新增 folder_id 引數 (#29477)

其他

  • BigQuery 傳輸 運算子新增 文件 (#29466)

8.9.0

特性

  • 為現有 ''DataprocDeleteClusterOperator'' 新增 可延期 功能 (#29349)

  • dataflow 運算子新增 可延期 模式 (#27776)

  • DataprocCreateBatchOperator 新增 可延期 模式 (#28457)

  • DataprocCreateClusterOperator DataprocUpdateClusterOperator 新增 可延期 模式 (#28529)

  • MLEngineStartTrainingJobOperator 新增 可延期 模式 (#27405)

  • DataFusionStartPipelineOperator 新增 可延期 模式 (#28690)

  • Big Query Transfer 運算子新增 可延期 模式 (#27833)

  • 新增 BaseSQLToGCSOperator write_on_empty 的支援 (#28959)

  • 新增 DataprocCancelOperationOperator (#28456)

  • 啟用 單獨的 觸發器 日誌記錄 (#27758)

  • Auto ML 資產 (#25466)

Bug 修復

  • 修復 GoogleDriveHook 在上傳 v2 時將檔案寫入已放入回收站的資料夾 (#29119)

  • 修復 Google provider CHANGELOG.rst (#29122)

  • 修復 Google provider CHANGELOG.rst (#29114)

  • Keyfile dict 可以是 dict 而不是 str (#29135)

  • GCSTaskHandler 可能使用 遠端 日誌 conn id (#29117)

其他

  • 棄用 GCP 運算子中的 'delegate_to' 引數並更新文件 (#29088)

8.8.0

特性

  • 新增 可延期 ''GCSObjectExistenceSensorAsync'' (#28763)

  • 支援 BaseSQLToGCSOperator 中的 partition_columns (#28677)

Bug 修復

  • 'BigQueryCreateExternalTableOperator' 修復了 欄位 分隔符 不適用於 csv 的問題 (#28856)

  • 修復了使用私有 _get_credentials 而不是公共 get_credentials 的問題 (#28588)

  • 修復了 'QUEUED' 狀態的 'GoogleCampaignManagerReportSensor' (#28735)

  • 修復了 BigQueryColumnCheckOperator 執行時錯誤 (#28796)

  • "datasetReference" 屬性分配給 dataset_reference dict。 如果 bigquery hook create_empty_dataset 方法中尚未設定,則預設使用 (#28782)

8.7.0

特性

  • table_resource 新增到 template 欄位中, 用於 BigQueryCreateEmptyTableOperator (#28235)

  • GCSObjectExistenceSensor 中新增 retry 引數 (#27943)

  • preserveAsciiControlCharacters 新增到 src_fmt_configs (#27679)

  • deferrable 模式 新增到 CloudBuildCreateBuildOperator (#27783)

  • GCSToBigQueryOperator 允許 自動檢測 None 並推斷 schema (#28564)

  • 改進 Dataproc deferrable operators 中的 記憶體 使用 (#28117)

  • dataproc submit job op 推送 job_id xcom (#28639)

Bug修復

  • 修復了 GCSToBigQueryOperator 中讀取 JSON 檔案的 schema 欄位的問題 (#28284)

  • 修復 GCSToBigQueryOperator 不遵守 schema_obj 的問題 (#28444)

  • 修復 GCSToGCSOperator 複製不帶 萬用字元的 物件列表 的問題 (#28111)

  • 修復: 重新啟用 gcs_to_bq 中使用引數, 之前已被停用 (#27961)

  • 正確設定 bigquery ''use_legacy_sql'' 引數 job config (#28522)

其他

  • 刪除 'pylint' 訊息 控制 指令 (#28555)

  • google/provider.yaml 刪除已棄用的 AIPlatformConsoleLinkk (#28449)

  • config.yml 中使用 object 代替 array 作為 config template (#28417)

  • [misc] 移除 conditions 中的 'pass' 語句 (#27775)

  • google secret manager 找不到 secret 時, log 級別更改為 DEBUG (#27856)

  • [misc] providers 中使用 'exactly_one' 輔助函式替換 XOR '^' 條件 (#27858)

8.6.0

特性

  • 無論 job 狀態如何,都為 workflow operators 保留 DataprocLink (#26986)

  • BigQueryToGCSOperator 的可延遲 模式 (#27683)

  • BigQueryToGCSOperator 中的 模板 欄位中新增 匯出 格式 (#27910)

Bug修復

  • 修復 BigQueryToBigQueryOperator 中正確讀取 location 引數的問題 (#27661)

  • common.sql provider 升級到 1.3.1 (#27888)

8.5.0

注意

正如 Apache Airflow providers 支援策略中所述,此 provider 版本僅適用於 Airflow 2.3+

其他

  • 所有 providers 的最小 airflow 版本移動到 2.3.0 (#27196)

  • hook bigquery 函式 '_bq_cast' 重新命名為 'bq_cast' (#27543)

  • BigQueryHook 中使用非棄用方法 on_kill (#27547)

  • 型別轉換 biquery job response col value (#27236)

  • 刪除 google-cloud-storage 上 <2 的限制 (#26922)

  • urlparse 替換為 urlsplit (#27389)

特性

當在環境變數或 secrets backend 中定義連線時,之前 extra 欄位需要使用字首 extra__google_cloud_platform__ 定義。現在不再需要了。因此,例如,您可以將 keyfile json 儲存為 keyfile_dict 而不是 extra__google_cloud_platform__keyfile_dict。如果兩者都存在,則優先使用短名稱。

  • 新增與舊版本的 Apache Beam 的向後相容性 (#27263)

  • GCSToBigQueryOperator 新增 deferrable 模式 + 測試 (#27052)

  • 在新方法中為 Vertex AI operators 新增系統測試 (#27053)

  • Dataform operators、連結、更新系統測試和文件 (#27144)

  • 允許 WorkflowsCreateExecutionOperator execution 引數中的值是字典 (#27361)

  • DataflowStopJobOperator Operator (#27033)

  • 允許覆蓋 Postgres json/jsonb 列資料型別的 stringify_dict #26875 (#26876)

  • 允許並優先使用 dataprep hook 的非字首 extra 欄位 (#27039)

  • 更新 google hooks 以優先使用非字首 extra 欄位 (#27023)

Bug修復

  • 新增新的 Compute Engine Operators 並修復系統測試 (#25608)

  • Common sql bugfixes 和改進 (#26761)

  • 修復 Dataproc CreateBatch operator 中的延遲 (#26126)

  • 刪除 signature 中單個引數周圍的不必要換行符 (#27525)

  • 取消 BigQuery job 時,設定 project_id location (#27521)

  • 使用正確的 key 來檢索 dataflow job_id (#27336)

  • 當沒有值時,使 GSheetsHook 返回一個空列表 (#27261)

  • Cloud ML Engine operators assets (#26836)

8.4.0

特性

  • 新增 BigQuery 列和表檢查 Operators (#26368)

  • 新增 deferrable big query operators sensors (#26156)

  • 'output' 屬性新增到 MappedOperator (#25604)

  • DataflowTemplatedJobStartOperator 新增 append_job_name 引數 (#25746)

  • GoogleDriveHook 中新增一個引數用於排除已放入回收站的檔案 (#25675)

  • 雲資料防丟失 (Data Loss Prevention) 運算子資產 (#26618)

  • 雲端儲存轉移 (Storage Transfer) 運算子資產 & 系統測試遷移 (AIP-47) (#26072)

  • 將可延期的 (deferrable) BigQuery 操作符合併到現有運算子中 (#26433)

  • delete/create cluster 中呼叫 wait_for_operation 時指定 project id (#26418)

  • 在 Web UI 中自動跟蹤檔案日誌 (#26169)

  • 雲函式 (Cloud Functions) 運算子資產 & 系統測試遷移 (AIP-47) (#26073)

  • GCSToBigQueryOperator 解決 'max_id_key' 作業檢索和 xcom 返回問題 (#26285)

  • 允許覆蓋 BaseSQLToGCSOperatorjson 匯出格式的 'stringify_dict' (#26277)

  • 在連結類中附加 GoogleLink 基礎連結 (#26057)

  • 雲影片智慧 (Cloud Video Intelligence) 運算子資產 & 系統測試遷移 (AIP-47) (#26132)

  • 生命科學 (Life Science) 資產 & 系統測試遷移 (AIP-47) (#25548)

  • GCSToBigQueryOperator 允許 schema_object 位於備用 GCS Bucket 中 (#26190)

  • 在可延期模式下,為 Composer 運算子使用 AsyncClient (#25951)

  • 使用 project_id 獲取已認證的客戶端 (#25984)

  • 雲構建 (Cloud Build) 資產 & 系統測試遷移 (AIP-47) (#25895)

  • Dataproc 提交作業運算子非同步 (#25302)

  • BigQueryGetDataOperator 中支援 project_id 引數 (#25782)

Bug 修復

  • 修復 Datafusion 運算子中的 JSONDecodeError (#26202)

  • 修復 CreateWorkflowInvocation 中永不結束的迴圈 (#25737)

  • 更新 gcs.py (#26570)

  • 當 BQ cursor 作業沒有 schema 時,不要丟擲異常 (#26096)

  • 用於佇列為空的 Google Cloud Tasks Sensor (#25622)

  • 更正傳輸配置名稱。 (#25719)

  • 修復 BigQuery 結果 Schema 中可選 'mode' 欄位的解析 (#26786)

  • 修復 GCSToBigQueryOperatorMaxID 邏輯 (#26768)

其他

  • Sql to GSC 運算子更新 parquet 格式的文件 (#25878)

  • 限制 Google Protobuf,以相容 biggtable 客戶端 (#25886)

  • 使 GoogleBaseHook 憑證函式公開 (#25785)

  • 整合到一個 'schedule' 引數 (#25410)

8.3.0

新特性

  • BigQueryCursor 類中新增 description 方法 (#25366)

  • 在兩個 BQ 運算子中新增 project_id 作為模板變數 (#24768)

  • 刪除 Amazon provider 中已棄用的模組 (#25543)

  • 將所有 "舊" SQL 運算子移動到 common.sql providers (#25350)

  • 使用 ParamSpec 改進 taskflow 型別提示 (#25173)

  • 使用覆蓋它的方法統一 DbApiHook.run() 方法 (#23971)

  • ParamSpec 提升 typing-extensionsmypy (#25088)

  • 棄用 hql 引數並同步 DBApiHook 方法 API (#25299)

  • Dataform 運算子 (#25587)

Bug 修復

  • 修復 GCSListObjectsOperator 文件字串 (#25614)

  • 修復 BigQueryInsertJobOperator cancel_on_kill (#25342)

  • 修復 BaseSQLToGCSOperator approx_max_file_size_bytes (#25469)

  • 修復 PostgresToGCSOperat bool dtype (#25475)

  • 修復 Vertex AI 自定義作業訓練問題 (#25367)

  • 修復 Flask Login 使用者設定為 Flask 2.2 和 Flask-Login 0.6.2 (#25318)

8.2.0

新特性

  • PubSub 資產 & 系統測試遷移 (AIP-47) (#24867)

  • 新增對現有 Dataproc 批處理狀態的處理 (#24924)

  • 為 Google Kubernetes Engine 運算子新增連結 (#24786)

  • 向 'GoogleBaseHook' 新增 test_connection 方法 (#24682)

  • gcp_conn_id 引數新增到 GoogleDriveToLocalOperator (#24622)

  • 為 AutoML 中的 column_transformations 引數新增 DeprecationWarning (#24467)

  • 修改 BigQueryCreateExternalTableOperator 以使用更新後的 hook 函式 (#24363)

  • 將所有 SQL 類移動到 common-sql provider (#24836)

  • Datacatalog 資產 & 系統測試遷移 (AIP-47) (#24600)

  • 將 FAB 升級到 4.1.1 (#24399)

Bug 修復

  • GCSDeleteObjectsOperator 空字首 bug 修復 (#24353)

  • perf(BigQuery): 將 table_id 作為 str 型別傳遞 (#23141)

  • 更新 providers 以使用 functools compat for ''cached_property'' (#24582)

8.1.0

新特性

  • 將 Oracle 庫更新到最新版本 (#24311)

  • 公開 SQL to GCS 元資料 (#24382)

Bug 修復

  • 修復 google provider additional extras 中的拼寫錯誤 (#24431)

  • BigQueryToGCPOpertor 中使用 insert_job 並調整連結 (#24416)

8.0.0

重大變更

注意

此 provider 版本僅適用於 Airflow 2.2+,如 Apache Airflow providers 支援策略中所述。

功能特性

  • 新增 key_secret_project_id 引數,用於指定包含 KeyFile 的專案 (#23930)

  • DataflowStartFlexTemplateOperator DataflowStartSqlJobOperator 添加了 impersonation_chain (#24046)

  • CLOUD_SQL_EXPORT_VALIDATION 新增 欄位。 (#23724)

  • 在使用 Compute Engine 中的 ADC 時,更新 憑據 (#23773)

  • cloud_sql.py 中, operators 設定 顏色 (#24000)

  • SQL GCS,支援 排除 (#23695)

  • [Issue#22846] 允許選擇是否UUID進行編碼,當從Cassandra上傳到GCS (#23766)

  • 工作流資產&系統測試遷移(AIP-47) (#24105)

  • Spanner 資產 & 系統 測試 遷移 (AIP-47) (#23957)

  • 語音 文字 資產 & 系統 測試 遷移 (AIP-47) (#23643)

  • Cloud SQL 資產 & 系統 測試 遷移 (AIP-47) (#23583)

  • Cloud Storage 資產 & StorageLink 更新 (#23865)

Bug 修復

  • 修復 BigQueryInsertJobOperator (#24165)

  • 修復指向googleworkplace連結 (#24080)

  • 修復 DataprocJobBaseOperator 點式 名稱 不相容的問題 (#23439). (#23791)

  • BigQuery DTS hook 刪除 hack (#23887)

  • 修復 GCSToGCSOperator 無法 複製 單個 檔案/資料夾,而不會複製 具有 字首的 其他 檔案/資料夾的問題 (#24039)

  • 解決 biguery gcs 傳輸 job 競爭 bug (#24330)

其他

  • 修復 BigQuery 系統 測試 (#24013)

  • 確保 @contextmanager 修飾 生成器 函式 (#23103)

  • Dataproc 遷移到 新的 系統 測試 設計 (#22777)

  • AIP-47 - google leveldb DAG 遷移到 新的 設計 ##22447 (#24233)

  • per-run 日誌 模板 應用於 日誌 處理程式 (#24153)

7.0.0

重大更改

  • PubSub operators 刪除 已棄用的 引數: (#23261)

  • 升級支援GoogleAdsv10 (#22965)

  • 'DataprocJobBaseOperator' 更改 (#23350)

    • 'DataprocJobBaseOperator': 引數 順序 已更改。

    • 'region' 引數 沒有 預設值 受影響的函式/類: 'DataprocHook.cancel_job' 'DataprocCreateClusterOperator' 'DataprocJobBaseOperator'

  • 'DatastoreHook': 刪除 'datastore_conn_id'。 請使用 'gcp_conn_id' (#23323)

  • 'CloudBuildCreateBuildOperator': 刪除 'body'。 請使用 'build' (#23263)

  • 副本 叢集 id 刪除 (#23251)

    • 'BigtableCreateInstanceOperator' 刪除 'replica_cluster_id', 'replica_cluster_zone'。 請使用 'replica_clusters'

    • 'BigtableHook.create_instance': 刪除 'replica_cluster_id', 'replica_cluster_zone'。 請使用 'replica_clusters'

  • 刪除 引數 (#23230)

    • 'GoogleDisplayVideo360CreateReportOperator': 刪除 'params'。 請使用 'parameters'

    • 'FacebookAdsReportToGcsOperator': 刪除 'params'。 請使用 'parameters'

  • 'GoogleDriveToGCSOperator': 刪除 'destination_bucket' 'destination_object'。 請使用 'bucket_name' 'object_name' (#23072)

  • 'GCSObjectsWtihPrefixExistenceSensor' 已刪除。 請使用 'GCSObjectsWithPrefixExistenceSensor' (#23050)

  • 刪除 'project': (#23231)

    • 'PubSubCreateTopicOperator': 刪除 'project'。 請使用 'project_id'

    • 'PubSubCreateSubscriptionOperator': 刪除 'topic_project'。 請使用 'project_id'

    • 'PubSubCreateSubscriptionOperator': 刪除 'subscription_project'。 請使用 'subscription_project_id'

    • 'PubSubDeleteTopicOperator': 刪除 'project'。 請使用 'project_id'

    • 'PubSubDeleteSubscriptionOperator': 刪除 'project'。 請使用 'project_id'

    • 'PubSubPublishMessageOperator': 刪除 'project'。 請使用 'project_id'

    • 'PubSubPullSensor': 刪除 'project'。 請使用 'project_id'

    • 'PubSubPullSensor': 刪除 'return_immediately'

  • 刪除 'location' - 已替換為 'region' (#23250)

    • 'DataprocJobSensor': 刪除 'location'。 請使用 'region'

    • 'DataprocCreateWorkflowTemplateOperator': 刪除 'location'。 請使用 'region'

    • 'DataprocCreateClusterOperator': 刪除 'location'。 請使用 'region'

    • 'DataprocSubmitJobOperator': 刪除 'location'。 請使用 'region'

    • 'DataprocHook': 刪除 'location' 引數。 請使用 'region'

    • 受影響的函式有:

      • 'cancel_job'

      • 'create_workflow_template'

      • 'get_batch_client'

      • 'get_cluster_client'

      • 'get_job'

      • 'get_job_client'

      • 'get_template_client'

      • 'instantiate_inline_workflow_template'

      • 'instantiate_workflow_template'

      • 'submit_job'

      • 'update_cluster'

      • 'wait_for_job'

    • 'DataprocHook': 'wait_for_job' 函式中 引數的順序 已更改

    • 'DataprocSubmitJobOperator': 引數的順序 已更改。

  • 移除 xcom_push (#23252)

    • 'CloudDatastoreImportEntitiesOperator': 刪除 'xcom_push'。 請使用 'BaseOperator.do_xcom_push'

    • 'CloudDatastoreExportEntitiesOperator': 移除 'xcom_push'。 請使用 'BaseOperator.do_xcom_push'。

  • 'bigquery_conn_id' 'google_cloud_storage_conn_id' 已被移除。 請使用 'gcp_conn_id' (#23326).

    • 受影響的類:

      • 'BigQueryCheckOperator'

      • 'BigQueryCreateEmptyDatasetOperator'

      • 'BigQueryDeleteDatasetOperator'

      • 'BigQueryDeleteTableOperator'

      • 'BigQueryExecuteQueryOperator'

      • 'BigQueryGetDataOperator'

      • 'BigQueryHook'

      • 'BigQueryIntervalCheckOperator'

      • 'BigQueryTableExistenceSensor'

      • 'BigQueryTablePartitionExistenceSensor'

      • 'BigQueryToBigQueryOperator'

      • 'BigQueryToGCSOperator'

      • 'BigQueryUpdateTableSchemaOperator'

      • 'BigQueryUpsertTableOperator'

      • 'BigQueryValueCheckOperator'

      • 'GCSToBigQueryOperator'

      • 'ADLSToGCSOperator'

      • 'BaseSQLToGCSOperator'

      • 'CassandraToGCSOperator'

      • 'GCSBucketCreateAclEntryOperator'

      • 'GCSCreateBucketOperator'

      • 'GCSDeleteObjectsOperator'

      • 'GCSHook'

      • 'GCSListObjectsOperator'

      • 'GCSObjectCreateAclEntryOperator'

      • 'GCSToBigQueryOperator'

      • 'GCSToGCSOperator'

      • 'GCSToLocalFilesystemOperator'

      • 'LocalFilesystemToGCSOperator'

  • 'S3ToGCSOperator': 移除 'dest_gcs_conn_id'。 請使用 'gcp_conn_id' (#23348)

  • 'BigQueryHook' 變更 (#23269)

    • 'BigQueryHook.create_empty_table' 移除 'num_retries'。 請使用 'retry'

    • 'BigQueryHook.run_grant_dataset_view_access' 移除 'source_project'。 請使用 'project_id'

  • 'DataprocHook': 移除已棄用的函式 'submit' (#23389)

功能

  • [功能] google provider - BigQueryInsertJobOperator 日誌查詢 (#23648)

  • [功能] google provider - 拆分 GkeStartPodOperator 執行 (#23518)

  • 新增 exportContext.offload 標誌到 CLOUD_SQL_EXPORT_VALIDATION。 (#23614)

  • BiqTable 運算子建立連結 (#23164)

  • 實現 #22859 - 新增 .sql 作為可模板化的擴充套件 (#22920)

  • 'GCSFileTransformOperator': 新的模板化欄位 'source_object', 'destination_object' (#23328)

Bug 修復

  • 修復 'PostgresToGCSOperator' 不允許巢狀的 JSON (#23063)

  • 修復 GCSToGCSOperator 忽略 replace 引數,當沒有萬用字元時 (#23340)

  • 更新 processor 以修復損壞的下載連結 (#23299)

  • 'LookerStartPdtBuildOperator', 'LookerCheckPdtBuildSensor' : 修復空的物化 id 處理 (#23025)

  • 更改 ComputeSSH 丟擲 provider 匯入錯誤,而不是 paramiko (#23035)

  • 修復 DataprocSubmitJobOperator 在執行超時後 cancel_on_kill (#22955)

  • 修復 BigQueryGetDataOperator select * 查詢 xcom push (#22936)

  • MSSQLToGCSOperator 失敗: datetime 不是 JSON 可序列化的 (#22882)

其他

  • 新增 Stackdriver 資產並遷移系統測試到 AIP-47 (#23320)

  • CloudTasks 資產 & 系統測試遷移 (AIP-47) (#23282)

  • TextToSpeech 資產 & 系統測試遷移 (AIP-47) (#23247)

  • 修復 google provider 中的程式碼片段 (#23438)

  • Bigquery 資產 (#23165)

  • 移除 'BigQueryUpdateTableSchemaOperator' 中冗餘的文件字串 (#23349)

  • gcs 遷移到新的系統測試設計 (#22778)

  • 'BigQueryHook.create_empty_table' 中新增缺失的文件字串 (#23270)

  • 清理 Google provider CHANGELOG.rst (#23390)

  • 將系統測試 gcs_to_bigquery 遷移到新設計 (#22753)

  • 新增用於演示 GCS 感測器用法的示例 DAG (#22808)

  • 清理行內 f-string 連線 (#23591)

  • 更新 pre-commit hook 版本 (#22887)

  • 使用新的 Breese 來構建、拉取和驗證映象。 (#23104)

  • 修復主分支中的新的 MyPy 錯誤 (#22884)

6.8.0

功能

  • BQCreateExternalTable Operator 中新增 autodetect 引數 (#22710)

  • BigQuery 資料傳輸新增連結 (#22280)

  • 修改傳輸運算子以處理更多資料 (#22495)

  • Vertex AI 服務建立端點和服務模型、批次預測和超引數調整任務運算子 (#22088)

  • PostgresToGoogleCloudStorageOperator - 時區感知欄位的 BigQuery schema 型別 (#22536)

  • 更新 secrets 後端以使用 get_conn_value 代替 get_conn_uri (#22348)

Bug 修復

  • 修復文件字串 (#22497)

  • 修復 'GoogleDisplayVideo360SDFtoGCSOperator' 中的 'download_media' 連結 (#22479)

  • 修復 'CloudBuildRunBuildTriggerOperator' 無法找到 build id。 (#22419)

  • 如果 src 不存在,則 Fail ''LocalFilesystemToGCSOperator'' (#22772)

  • GCSTimeSpanFileTransformOperator 中移除 coerce_datetime 的用法 (#22501)

其他

  • 重構: BigQuery GCS Operator (#22506)

  • PubSub 運算子中移除對已棄用的運算子/引數的引用 (#22519)

  • 系統測試的新設計 (#22311)

6.7.0

功能

  • dataflow_default_options 新增到 templated_fields (#22367)

  • 新增 'LocalFilesystemToGoogleDriveOperator' (#22219)

  • BigQueryInsertJobOperator 新增超時和重試 (#22395)

Bug 修復

  • 修復跳過非 GCS 定位的 jars (#22302)

  • [FIX] gcs operator typo 文件 (#22290)

  • 修復錯誤地為所有 provider 新增的 install_requires (#22382)

6.6.0

功能

  • 支援 上傳 更大 的檔案 Google Drive (#22179)

  • 更改 預設 'chunk_size' 為一個 清晰的 表示 & 新增 文件 (#22222)

  • 新增 DataprocInstantiateInlineWorkflowTemplateOperator 指南 (#22062)

  • 允許 使用 GCS Hook 上傳 上傳 元資料 (#22058)

  • 新增 Dataplex 運算子 (#20377)

其他

  • 新增 ARM 平臺 的支援 (#22127)

  • PyPI 新增 Trove 分類器 (Framework :: Apache Airflow :: Provider)

  • 使用 yaml safe load (#22091)

6.5.0

功能

  • 新增 Looker PDT 運算子 (#20882)

  • 新增 自動檢測 引數 GCSToBigQueryOperator 外部 建立 (#21944)

  • 新增 Dataproc 資產/連結 (#21756)

  • Vertex AI 服務 新增 Auto ML 運算子 (#21470)

  • 新增 GoogleCalendarToGCSOperator (#20769)

  • 使 project_id 引數 所有 dataproc 運算子 變為 可選 (#21866)

  • 允許 更多 DataprocUpdateClusterOperator 欄位 中使用 模板 (#21865)

  • Dataflow 資產 (#21639)

  • 提取 ClientInfo 模組級別 (#21554)

  • Datafusion 資產 (#21518)

  • Dataproc 元資料儲存 資產 (#21267)

  • 標準化 BigQuery 感測器 *_conn_id 引數 (#21430)

缺陷修復

  • 修復 bigquery_dts 引數 文件字串 拼寫錯誤 (#21786)

  • 修復 use_server_side_cursor=True 時, PostgresToGCSOperator 結果集上 失敗 (#21307)

  • 修復 bigquery 示例 DAG 查詢 場景 (#21575)

其他

  • 支援 Python 3.10

  • 取消固定 'google-cloud-memcache' (#21912)

  • 取消固定 ''pandas-gbq'' 刪除 未使用的 程式碼 (#21915)

  • 抑制 來自 Bigquery 傳輸 hook 警告 (#20119)

6.4.0

功能

  • 新增 Google 日曆 整合 hook (#20542)

  • 編碼 引數 新增到 'GCSToLocalFilesystemOperator' 以修復 #20901 (#20919)

  • batch 作為 DataprocCreateBatchOperator 中的 模板化 欄位 (#20905)

  • 使 timeout 對於 wait_for_operation 變為 可選 (#20981)

  • 新增 更多 SQL 模板 欄位 渲染器 (#21237)

  • Vertex AI 服務 建立 CustomJob Datasets 運算子 (#21253)

  • 支援 檔案 上傳 Google 共享雲盤 (#21319)

  • (providers_google) bigquery 新增 位置 檢查 (#19571)

  • 新增 BeamGoPipelineOperator 的支援 (#20386)

  • Google Cloud Composer 運算子 (#21251)

  • BigQuery hook 啟用 非同步 作業 提交 (#21385)

  • 如果 原始檔 GCSToGCSOperator 不存在, 可以選擇 引發 錯誤 (#21391)

缺陷修復

  • Cloudsql 匯入 連結 修復。 (#21199)

  • 修復 BigQueryDataTransferServiceHook.get_transfer_run() 請求 引數 (#21293)

  • :bug: (BigQueryHook) 修復 sqlalchemy 引擎 相容性 (#19508)

其他

  • 重構 運算子 連結 以避免 建立 ad hoc TaskInstances (#21285)

6.3.0

功能

  • bigquery 資料 傳輸 服務 新增 可選 位置 (#15088) (#20221)

  • 新增 Google Cloud Tasks 操作指南 文件 (#20145)

  • MSSQL Google Cloud Storage (GCS) 新增 示例 DAG (#19873)

  • 支援 區域性 GKE 叢集 (#18966)

  • KubernetesPodOperator 預設 刪除 pod (#20575)

缺陷修復

  • 修復 PubSubCreateSubscriptionOperator 文件字串 (#20237)

  • 修復 Dataproc Metastore 缺少 get_backup 方法 (#20326)

  • BigQueryHook 修復 run_load 文件 字串 中的 拼寫錯誤 (#19924)

  • 修復 sftp_to_gcs 上傳遞 gzip 壓縮 引數 的問題。 (#20553)

  • CloudSQL provider 切換到 httpx.get 呼叫 中的 follow_redirects (#20239)

  • 避免 BigQuery 傳輸 運算子 棄用 警告 (#20502)

  • download_video 引數 更改為 resourceName (#20528)

  • 修復 big query mssql/mysql 傳輸 問題 (#20001)

  • 修復 ''provide_authorized_gcloud'' 設定 專案 ID 的問題 (#20428)

其他

  • source_objects 資料型別 檢查 移出 GCSToBigQueryOperator.__init__ (#20347)

  • Amazon Provider 組織 S3 (#20167)

  • 提供者 facebook hook 多賬戶 (#19377)

  • 移除已棄用的方法呼叫 (blob.download_as_string) (#20091)

  • 從 GoogleDriveToGCSOperator 移除已棄用的 template_fields (#19991)

注意! apache-airflow-providers-facebookapache-airflow-providers-amazon 的可選功能需要更新版本的提供者(如依賴項中所指定)

6.2.0

新特性

  • 為 DataprocJobSensor 新增等待機制,以避免在作業不可用時出現 509 錯誤 (#19740)

  • 在 GCP 連線中新增支援,以便從 Secret Manager 讀取金鑰 (#19164)

  • 新增 dataproc metastore 運算子 (#18945)

  • 為 GCloud Storage Transfer Service 運算子新增對 'path' 引數的支援 (#17446)

  • 將 Google Marketing Platform 運算子中的 'bucket_name' 驗證移出 '__init__' (#19383)

  • 建立 dataproc serverless spark batches 運算子 (#19248)

  • 更新 pipeline_timeout CloudDataFusionStartPipelineOperator (#18773)

  • 在 GKEStartPodOperator 中支援 impersonation_chain 引數 (#19518)

Bug 修復

  • 修復 GKEPodOperator 中合併錯誤的模擬 (#19696)

6.1.0

新特性

  • 為查詢的 'namespaceId' 新增值 (#19163)

  • 新增 pre-commit hook 以檢查檔案中的常見拼寫錯誤 (#18964)

  • 在 CassandraToGCSOperator 中支援查詢超時作為引數 (#18927)

  • 更新 BigQueryCreateExternalTableOperator 文件和引數 (#18676)

  • 替換 BigQueryToMsSqlOperator 的非屬性 template_fields (#19052)

  • 將 Dataproc 包升級到 3.0.0,並從 v1beta2 遷移到 v1 api (#18879)

  • 在子程序中執行 beam 命令時使用 google cloud 憑據 (#18992)

  • 替換 FacebookAdsReportToGcsOperator 的預設 api_version (#18996)

  • Dataflow 運算子 - 在 on_kill 方法中使用作業中的專案和位置。 (#18699)

Bug 修復

  • 修復 CloudSQL Hook 中硬編碼的 /tmp 目錄 (#19229)

  • 修復 Dataflow hook 中沒有返回作業時的錯誤 (#18981)

  • 修復 BigQueryToMsSqlOperator 文件 (#18995)

  • 將模板化輸入引數的驗證移動到上下文初始化之後執行 (#19048)

  • Google provider 捕獲無效的 secret 名稱 (#18790)

6.0.0

重大變更

  • 將 Google Cloud Build 從 Discovery API 遷移到 Python SDK (#18184)

新特性

  • 將索引新增到資料集名稱,以便為每個示例 DAG 擁有單獨的資料集 (#18459)

  • 為某些測試包新增缺少的 __init__.py 檔案 (#18142)

  • 新增從系統測試執行 DAG 並檢視 DAG 日誌的可能性 (#17868)

  • 將 AzureDataLakeStorage 重新命名為 ADLS (#18493)

  • 使 next_dagrun_info 接受資料間隔 (#18088)

  • 使用 parameters 代替 params (#18143)

  • 新的 google 運算子: SQLToGoogleSheetsOperator (#17887)

Bug 修復

  • 修復 Google 系統測試的一部分 (#18494)

  • 修復 kubernetes engine 系統測試 (#18548)

  • 修復 BigQuery 系統測試 (#18373)

  • 修復使用表資源建立外部表時出現的錯誤 (#17998)

  • 修復 ''BigQueryToMySqlOperator'' 中 ''BigQuery'' 資料提取 (#18073)

  • 使用 eager 升級修復 main 分支中的 providers 測試 (#18040)

  • fix(CloudSqlProxyRunner): 不要從 Airflow DB 查詢連線 (#18006)

  • 刪除 GCSToBigquery 中至少一個 schema 的檢查 (#18150)

  • 在 BigQueryInsertJobOperator 上刪除重複的執行作業 (#17496)

5.1.0

新特性

  • 在 GKEStartPodOperator 中為 config_file 引數新增錯誤檢查 (#17700)

  • Gcp ai 超引數調整 (#17790)

  • 如果指定了 'node_pools',則允許省略 'initial_node_count' (#17820)

  • [Airflow 13779] 在 wait_for_pipeline_state hook 中使用提供的引數 (#17137)

  • 在 'template_fields_renderers' 中啟用指定字典路徑 (#17321)

  • 不要快取 Google Secret Manager 客戶端 (#17539)

  • [AIRFLOW-9300] 新增 DatafusionPipelineStateSensor aync 選項 CloudDataFusionStartPipelineOperator (#17787)

Bug 修復

  • GCP Secret Manager 處理 缺失 憑據的 錯誤 (#17264)

其他

  • 最佳化 Airflow 2.2.0 連線 匯入

  • 新增 secrets 後端/日誌/身份驗證 資訊 provider yaml (#17625)

5.0.0

重大變更

  • 更新 GoogleAdsHook 以支援 較新的 API 版本, google 棄用 v5 之後。 Google Ads v8 新的 預設 API。 (#17111)

  • Google Ads Hook: 支援 google-ads 庫的 較新 版本 (#17160)

警告

底層 google-ads 庫有重大變更。

以前,google ads 庫將資料作為原生 protobuf 訊息返回。 現在它將資料作為 proto-plus 物件返回,這些物件更像傳統的 Python 物件。

為了保持相容性,hook 的 search() 將資料轉換回原生 protobuf 然後再返回。 您現有的運算子 *應該* 像以前一樣工作,但由於 v5 API 被棄用的緊迫性,因此沒有經過非常徹底的測試。 因此,您應該仔細評估此新版本的運算子和 hook 功能。

為了使用 API 的新 proto-plus 格式,您可以使用 search_proto_plus() 方法。

有關更多資訊,請參閱 google-ads 遷移文件

功能

  • dataproc 位置 引數 標準化為 區域 (#16034)

  • 新增 自定義 Salesforce 連線 型別 + SalesforceToS3Operator 更新 (#17162)

Bug 修復

  • 更新 Google Memmcache field_mask 別名 (#16975)

  • fix: dataprocpysparkjob project_id 作為 self.project_id (#17075)

  • 修復 GCStoGCS 運算子, 其中 replace 停用, 並且存在 目標 物件 (#16991)

4.0.0

重大變更

  • 自動應用 apply_default 裝飾器 (#15667)

警告

由於刪除了 apply_default 裝飾器,此 provider 版本需要 Airflow 2.1.0+。 如果您的 Airflow 版本 < 2.1.0,並且您想安裝此 provider 版本,請首先將 Airflow 升級到至少版本 2.1.0。 否則,您的 Airflow 包版本將自動升級,您必須手動執行 airflow upgrade db 才能完成遷移。

  • plyvel 移動到 google provider 額外 (#15812)

  • 修復 AzureFileShare 連線 額外 (#16388)

功能

  • google dataproc 新增 額外的 連結 (#10343)

  • 新增 oracle  連線 連結 (#15632)

  • wait_for_done 引數 向下 傳遞給 _DataflowJobsController (#15541)

  • 僅在 GoogleAdsHook 使用 api 版本, 而不是 運算子 (#15266)

  • 實現 BigQuery 架構 更新 運算子 (#15367)

  • 新增 BigQueryToMsSqlOperator (#15422)

Bug 修復

  • 修復: GCS To BigQuery source_object (#16160)

  • 修復: ``GCSToLocalFilesystemOperator 不必要的 下載 (#16171)``

  • 修復 匯出 格式 parquet 時,bigquery 型別 錯誤 (#16027)

  • 修復 bucket object 引數 排序 型別 (#15738)

  • 修復 sql_to_gcs docstring lint 錯誤 (#15730)

  • fix: 確保 datetime 相關 完全 相容 MySQL BigQuery (#15026)

  • 修復 google provider 中的 棄用 警告 位置 (#16403)

3.0.0

重大變更

AutoMLPredictOperator 中的更改

airflow.providers.google.cloud.operators.automl.AutoMLPredictOperator 類中的 params 引數已重新命名為 operation_params,因為它與 BaseOperator 類中的 param 引數衝突。

apache.beam provider 的整合

在 provider 的 3.0.0 版本中,我們更改了與 apache.beam provider 整合的方式。 當嘗試使用 PIP > 20.2.4 將兩個 provider 一起安裝時,之前的 provider 版本會導致衝突。 PIP 20.2.4 及以下版本未檢測到此衝突,但衝突確實存在,並且 Google BigQuery python 客戶端的版本在兩端不匹配。 因此,當同時安裝 apache.beamgoogle provider 時,BigQuery 運算子的某些功能可能無法正常工作。 這是由 apache-beam 客戶端尚未支援新的 google python 客戶端造成的,當使用 apache-beam[gcp] 額外項時。 Dataflow 運算子使用 apache-beam[gcp] 額外項,雖然它們可以使用較新版本的 Google BigQuery python 客戶端,但這不能保證。

此版本為 google provider 的 apache.beam 額外項引入了額外的額外需求,並且對稱地為 apache.beam provider 的 google 額外項引入了額外的需求。 googleapache.beam provider 預設情況下不使用這些額外項,但您可以在安裝 provider 時指定它們。 這樣做的後果是 Dataflow 運算子的某些功能可能不可用。

不幸的是,解決此問題的唯一 完整 解決方案是 apache.beam 遷移到新的 (>=2.0.0) Google Python 客戶端。

這是 google provider 的額外項

extras_require = (
    {
        # ...
        "apache.beam": ["apache-airflow-providers-apache-beam", "apache-beam[gcp]"],
        # ...
    },
)

同樣,這是 apache.beam provider 的額外項

extras_require = ({"google": ["apache-airflow-providers-google", "apache-beam[gcp]"]},)

您仍然可以使用 PIP 版本 <= 20.2.4 執行此程式碼並返回到之前的行為

pip install apache-airflow-providers-google[apache.beam]

pip install apache-airflow-providers-apache-beam[google]

但請注意,在這種情況下,某些 BigQuery 運算子功能可能不可用。

功能

  • [Airflow-15245] - 自定義 映象 系列 名稱 傳遞給 DataProcClusterCreateoperator (#15250)

Bug 修復

  • Bugfix: 修復 ''GCSToLocalFilesystemOperator'' ''object_name'' 呈現 (#15487)

  • 修復 DataprocCreateClusterOperator 中的 拼寫錯誤 (#15462)

  • 修復 leveldb hook 中錯誤 指定的 路徑 (#15453)

2.2.0

特性

  • 新增 'Trino' 提供者 (測試時佔用 更少的 記憶體) (#15187)

  • 更新 operators 剩餘的 匯入 路徑 (#15127)

  • 覆蓋 dataprocSubmitJobOperator 中的 project (#14981)

  • 帶有 標籤 描述 引數的 GCS BigQuery 傳輸 Operator (#14881)

  • 新增 GCS 時間跨度 轉換 operator (#13996)

  • bigquery 檢查 operators 新增 作業 標籤。 (#14685)

  • 在可用時使用 libyaml C 庫。 (#14577)

  • 新增 Google leveldb hook operator (#13109) (#14105)

Bug 修復

  • Google Dataflow Hook 處理 沒有 Job 型別的情況 (#14914)

2.1.0

特性

  • 修正 GCSHook.download 方法中 docstring 的引數 順序 (#14497)

  • 重構 SQL/BigQuery/Qubole/Druid 檢查 operators (#12677)

  • 新增 GoogleDriveToLocalOperator (#14191)

  • 新增 'exists_ok' 標誌到 BigQueryCreateEmptyTable(Dataset)Operator (#14026)

  • 新增 BigQuery 物化檢視 支援 (#14201)

  • 新增 BigQueryUpdateTableOperator (#14149)

  • CloudDataTransferServiceOperator 新增 param (#14118)

  • 新增 gdrive_to_gcs operator, drive sensor, 以及 drive hook 附加功能 (#13982)

  • 改進 GCSToSFTPOperator 路徑 處理 (#11284)

Bug 修復

  • 修復 dataproc operators hook 的問題 (#14086)

  • #9803 修復 沒有 萬用字元 複製 操作 中的 bug (#13919)

2.0.0

重大變更

更新了 google-cloud-*

此提供者軟體包的版本包含第三方庫的更新,如果使用這些庫中的物件,可能需要更新 DAG 檔案或自定義 hook 和 operator。 更新這些庫是必要的,以便能夠使用新版本庫提供的新功能,並獲得僅適用於新版本庫的 bug 修復。

詳細資訊包含在每個庫的 UPDATING.md 檔案中,但有一些細節您應該注意。

庫名稱

之前的約束

當前的約束

升級文件

google-cloud-automl

>=0.4.0,<2.0.0

>=2.1.0,<3.0.0

升級 google-cloud-automl

google-cloud-bigquery-datatransfer

>=0.4.0,<2.0.0

>=3.0.0,<4.0.0

升級 google-cloud-bigquery-datatransfer

google-cloud-datacatalog

>=0.5.0,<0.8

>=3.0.0,<4.0.0

升級 google-cloud-datacatalog

google-cloud-dataproc

>=1.0.1,<2.0.0

>=2.2.0,<3.0.0

升級 google-cloud-dataproc

google-cloud-kms

>=1.2.1,<2.0.0

>=2.0.0,<3.0.0

升級 google-cloud-kms

google-cloud-logging

>=1.14.0,<2.0.0

>=2.0.0,<3.0.0

升級 google-cloud-logging

google-cloud-monitoring

>=0.34.0,<2.0.0

>=2.0.0,<3.0.0

升級 google-cloud-monitoring

google-cloud-os-login

>=1.0.0,<2.0.0

>=2.0.0,<3.0.0

升級 google-cloud-os-login

google-cloud-pubsub

>=1.0.0,<2.0.0

>=2.0.0,<3.0.0

升級 google-cloud-pubsub

google-cloud-tasks

>=1.2.1,<2.0.0

>=2.0.0,<3.0.0

升級 google-cloud-task

欄位名稱使用 snake_case 約定

如果您的 DAG 使用透過 XCom 傳遞的上述庫中的物件,則必須更新所讀取欄位的命名約定。 以前,這些欄位使用 CamelSnake 約定,現在使用 snake_case 約定。

之前

set_acl_permission = GCSBucketCreateAclEntryOperator(
    task_id="gcs-set-acl-permission",
    bucket=BUCKET_NAME,
    entity="user-{{ task_instance.xcom_pull('get-instance')['persistenceIamIdentity'].split(':', 2)[1] }}",
    role="OWNER",
)

之後

set_acl_permission = GCSBucketCreateAclEntryOperator(
    task_id="gcs-set-acl-permission",
    bucket=BUCKET_NAME,
    entity="user-{{ task_instance.xcom_pull('get-instance')['persistence_iam_identity']"
    ".split(':', 2)[1] }}",
    role="OWNER",
)

特性

  • 新增 Apache Beam operators (#12814)

  • 新增 Google Cloud Workflows Operators (#13366)

  • 使用 'GCSHook' 時,將 'google_cloud_storage_conn_id' 替換為 'gcp_conn_id' (#13851)

  • Dataflow 新增 操作指南 (#13461)

  • MLEngineStartTrainingJobOperator 推廣到 自定義映象 (#13318)

  • Parquet 資料 型別新增到 BaseSQLToGCSOperator (#13359)

  • 新增 DataprocCreateWorkflowTemplateOperator (#13338)

  • 新增 OracleToGCS 傳輸 (#13246)

  • gcs hook 方法新增 超時 選項。 (#13156)

  • dataproc 工作流 模板 operators 新增 區域 支援 (#12907)

  • project_id 新增到 BigQuery hook update_table 方法內的 客戶端 (#13018)

Bug 修復

  • 修復 StackdriverTaskHandler 中的 四個 bug (#13784)

  • 解碼 遠端 Google 日誌 (#13115)

  • 修復 並改進 GCP BigTable hook 系統 測試 (#13896)

  • 更新 Google DV360 Hook 以修復 SDF 問題 (#13703)

  • 修復 BigQueryHook insert_all 方法以支援沒有 schema 的表 (#13138)

  • 修復 Google BigQueryHook 方法 get_schema() (#13136)

  • 修復 Data Catalog operators (#13096)

1.0.0

提供者的初始版本。

此條目是否有幫助?