airflow.providers.apache.hive.transfers.vertica_to_hive¶

此模組包含一個運算子，用於將資料從 Vertica 移動到 Hive。

類¶

VerticaToHiveOperator

將資料從 Vertica 移動到 Hive。

模組內容¶

class airflow.providers.apache.hive.transfers.vertica_to_hive.VerticaToHiveOperator(*, sql, hive_table, create=True, recreate=False, partition=None, delimiter=chr(1), vertica_conn_id='vertica_default', hive_cli_conn_id='hive_cli_default', hive_auth=None, **kwargs)[source]¶

基類: airflow.models.BaseOperator

將資料從 Vertica 移動到 Hive。

此運算子對 Vertica 執行您的查詢，在將檔案載入到 Hive 表之前將其本地儲存。如果 create 或 recreate 引數設定為 True，則會生成 CREATE TABLE 和 DROP TABLE 語句。Hive 資料型別是從遊標的元資料推斷出來的。請注意，在 Hive 中生成的表使用 STORED AS textfile，這不是最高效的序列化格式。如果載入大量資料和/或表被頻繁查詢，您可能只想使用此運算子將資料暫存到臨時表中，然後使用 HiveOperator 將其載入到最終目的地。

引數:

sql (str) – 對 Vertica 資料庫執行的 SQL 查詢。(支援模板)
hive_table (str) – 目標 Hive 表，使用點號表示法指定特定資料庫。(支援模板)
create (bool) – 如果表不存在是否建立
recreate (bool) – 是否在每次執行時刪除並重新建立表
partition (dict | None) – 目標分割槽，格式為分割槽列和值的字典。(支援模板)
delimiter (str) – 檔案中的欄位分隔符
vertica_conn_id (str) – 源 Vertica 連線
hive_cli_conn_id (str) – 對 Hive CLI 連線 ID 的引用。
hive_auth (str | None) – 用於 Hive 連線的可選認證選項

template_fields: collections.abc.Sequence[str] = ('sql', 'partition', 'hive_table')[source]¶

template_ext: collections.abc.Sequence[str] = ('.sql',)[source]¶

template_fields_renderers[source]¶

ui_color = '#b4e0ff'[source]¶

sql[source]¶

hive_table[source]¶

partition = None[source]¶

create = True[source]¶

recreate = False[source]¶

delimiter = ''[source]¶

vertica_conn_id = 'vertica_default'[source]¶

hive_cli_conn_id = 'hive_cli_default'[source]¶

hive_auth = None[source]¶

classmethod type_map(vertica_type)[source]¶

手動修改 Vertica-Python 型別對映。

預設的 datatype.py 不提供完整的型別對映訪問。

參考: https://github.com/uber/vertica-python/blob/master/vertica_python/vertica/column.py

execute(context)[source]¶

建立運算子時推導。

Context 是與渲染 jinja 模板時使用的字典相同。

有關更多上下文，請參閱 get_template_context。