Apache Trino 連線¶
Apache Trino 連線型別允許連線到 Trino,Trino 是一個分散式 SQL 查詢引擎,旨在查詢分佈在一個或多個異構資料來源上的大型資料集。
預設連線 ID¶
Trino Hook 對連線 ID 使用引數 trino_conn_id,預設情況下該引數的值為 trino_default。Trino Hook 支援多種認證型別,以確保所有系統使用者都經過認證,可以設定引數 auth 來啟用認證。預設情況下,該引數的值為 None。
配置連線¶
- 主機
要連線到的主機,可以是
local、yarn或 URL。- 埠
如果主機是 URL,請指定埠。
- 登入使用者
用於連線的有效使用者。
- 密碼
用於啟用基本認證。這是一個可選引數,如果使用不同的認證機制,則不需要。
- Extra(可選,連線引數)
指定可在 Trino 連線中使用的額外引數(JSON 字典格式)。支援以下非標準 Python 引數:
auth- 指定需要啟用哪種認證型別。值可以是certs、kerberos或jwtimpersonate_as_owner- 一個布林值,允許將AIRFLOW_CTX_DAG_OWNER設定為連線的使用者。
可以使用以下額外引數來配置認證
jwt__token- 如果應使用 jwt 認證,透過此引數提供 token 的值。jwt__file- 如果應使用 jwt 認證,此引數指定包含 jwt token 的檔案在磁碟上的位置。certs__client_cert_path,certs__client_key_path- 如果應使用證書認證,透過這些引數提供客戶端證書和金鑰的路徑。kerberos__service_name,kerberos__config,kerberos__mutual_authentication,kerberos__force_preemptive,kerberos__hostname_override,kerberos__sanitize_mutual_error_response,kerberos__principal,kerberos__delegate,kerberos__ca_bundle- 在啟用kerberos認證時,可以設定這些引數。session_properties- 允許設定 session_properties 的 JSON 字典。示例:{'session_properties':{'scale_writers':true,'task_writer_count:1'}}client_tags- 逗號分隔的標籤列表。示例{'client_tags':['sales','cluster1']}`timezone- 會話的時區可以使用 IANA 時區名稱明確設定。示例:{'timezone':'Asia/Jerusalem'}。
注意:如果同時提供了
jwt__file和jwt__token,jwt__file將優先使用。