airflow.providers.apache.hdfs.hooks.webhdfs¶
Web HDFS 的 Hook。
屬性¶
異常¶
WebHDFS hook 特定的異常。 |
類¶
與 HDFS 互動。此類是 hdfscli 庫的包裝器。 |
模組內容¶
- exception airflow.providers.apache.hdfs.hooks.webhdfs.AirflowWebHDFSHookException[source]¶
繼承自:
airflow.exceptions.AirflowExceptionWebHDFS hook 特定的異常。
- class airflow.providers.apache.hdfs.hooks.webhdfs.WebHDFSHook(webhdfs_conn_id=default_conn_name, proxy_user=None)[source]¶
繼承自:
airflow.hooks.base.BaseHook與 HDFS 互動。此類是 hdfscli 庫的包裝器。
- get_conn()[source]¶
根據透過配置或環境變數設定的安全模式建立連線。
- 返回值:
hdfscli InsecureClient 或 KerberosClient 物件。
- 返回型別:
Any
- load_file(source, destination, overwrite=True, parallelism=1, **kwargs)[source]¶
將檔案上傳到 HDFS。
- 引數:
source (str) – 本地檔案或資料夾的路徑。如果是一個資料夾,其中的所有檔案都將被上傳。 .. 注意:: 這意味著空的資料夾不會在遠端建立。
destination (str) – 目標 HDFS 路徑。如果已存在且是一個目錄,檔案將被上傳到其中。
overwrite (bool) – 覆蓋任何現有的檔案或目錄。
parallelism (int) – 用於並行化的執行緒數。值為 0(或負數)時,使用的執行緒數與檔案數相同。
kwargs (Any) – 轉發給
hdfs.client.Client.upload()的關鍵字引數。