Hive CLI 連線

Hive CLI 連線型別啟用 Hive CLI 整合。

認證到 Hive CLI

使用 Airflow 連線到 Hive 有兩種方式。

  1. 使用 Hive Beeline。即,使用主機、埠和 schema 建立 JDBC 連線字串。或者,您可以使用代理使用者連線,並指定登入名和密碼。

  2. 使用 Hive CLI。即,在 extras 欄位中指定 Hive CLI 引數。

一次只能使用一種授權方法。如果您需要管理多個憑據或金鑰,則應配置多個連線。

預設連線 ID

預設情況下,所有與 Hive_CLI 相關的 hook 和 operator 都使用 hive_cli_default

配置連線

登入名 (可選)

指定代理使用者或 Beeline CLI 的使用者名稱。

密碼 (可選)

指定您的 Beeline CLI 密碼。

主機 (可選)

指定用於 Hive Beeline 的 JDBC Hive 主機。

埠 (可選)

指定用於 Hive Beeline 的 JDBC Hive 埠。

Schema (可選)

指定您要使用 Beeline 連線的 JDBC Hive 資料庫,或指定使用 Hive CLI 執行 HQL 語句的 schema。

使用 Beeline (可選)

如果使用 Beeline CLI,請指定為 True。預設值為 False

代理使用者 (可選)

指定一個代理使用者來以該使用者的身份執行 HQL 程式碼。

Principal (可選)

指定用於 Hive Beeline 的 JDBC Hive principal。

高可用性 (可選)

如果想連線執行在高可用模式下的 Hive 安裝,請指定為 True。相應地指定主機。

在環境變數中指定連線時,應使用 URI 語法進行指定。

請注意,URI 的所有元件都應該進行 URL 編碼。

例如

export AIRFLOW_CONN_HIVE_CLI_DEFAULT='hive-cli://beeline-username:beeline-password@jdbc-hive-host:80/hive-database?hive_cli_params=params&use_beeline=True&auth=noSasl&principal=hive%2F_HOST%40EXAMPLE.COM'

這篇文章是否有幫助?