Apache Trino 連線

Apache Trino 連線型別允許連線到 Trino,Trino 是一個分散式 SQL 查詢引擎,旨在查詢分佈在一個或多個異構資料來源上的大型資料集。

預設連線 ID

Trino Hook 對連線 ID 使用引數 trino_conn_id,預設情況下該引數的值為 trino_default。Trino Hook 支援多種認證型別,以確保所有系統使用者都經過認證,可以設定引數 auth 來啟用認證。預設情況下,該引數的值為 None

配置連線

主機

要連線到的主機,可以是 localyarn 或 URL。

如果主機是 URL,請指定埠。

登入使用者

用於連線的有效使用者。

密碼

用於啟用基本認證。這是一個可選引數,如果使用不同的認證機制,則不需要。

Extra(可選,連線引數)

指定可在 Trino 連線中使用的額外引數(JSON 字典格式)。支援以下非標準 Python 引數:

  • auth - 指定需要啟用哪種認證型別。值可以是 certskerberosjwt

  • impersonate_as_owner - 一個布林值,允許將 AIRFLOW_CTX_DAG_OWNER 設定為連線的使用者。

可以使用以下額外引數來配置認證

  • jwt__token - 如果應使用 jwt 認證,透過此引數提供 token 的值。

  • jwt__file - 如果應使用 jwt 認證,此引數指定包含 jwt token 的檔案在磁碟上的位置。

  • certs__client_cert_path, certs__client_key_path- 如果應使用證書認證,透過這些引數提供客戶端證書和金鑰的路徑。

  • kerberos__service_name, kerberos__config, kerberos__mutual_authentication, kerberos__force_preemptive, kerberos__hostname_override, kerberos__sanitize_mutual_error_response, kerberos__principal, kerberos__delegate, kerberos__ca_bundle - 在啟用 kerberos 認證時,可以設定這些引數。

  • session_properties - 允許設定 session_properties 的 JSON 字典。示例:{'session_properties':{'scale_writers':true,'task_writer_count:1'}}

  • client_tags - 逗號分隔的標籤列表。示例 {'client_tags':['sales','cluster1']}`

  • timezone - 會話的時區可以使用 IANA 時區名稱明確設定。示例:{'timezone':'Asia/Jerusalem'}

注意:如果同時提供了 jwt__filejwt__tokenjwt__file 將優先使用。

此條目有幫助嗎?