Apache Pig 運算子¶
Apache Pig 是一個用於分析大型資料集的平臺,它包含一種用於表達資料分析程式的高階語言,並與用於評估這些程式的基礎設施相結合。Pig 程式易於大規模並行化,這反過來使它們能夠處理非常大的資料集。
使用 PigOperator 來執行 Pig 指令碼。
tests/system/apache/pig/example_pig.py
run_this = PigOperator(
task_id="run_example_pig_script",
pig="ls /;",
pig_opts="-x local",
)