Apache Pig 運算子

Apache Pig 是一個用於分析大型資料集的平臺,它包含一種用於表達資料分析程式的高階語言,並與用於評估這些程式的基礎設施相結合。Pig 程式易於大規模並行化,這反過來使它們能夠處理非常大的資料集。

使用 PigOperator 來執行 Pig 指令碼。

tests/system/apache/pig/example_pig.py

    run_this = PigOperator(
        task_id="run_example_pig_script",
        pig="ls /;",
        pig_opts="-x local",
    )

此條目有幫助嗎?