Yandex.Cloud Data Proc 運算子

Yandex Data Proc 是一種服務,可幫助您在 Yandex Cloud 基礎設施中部署 Apache Hadoop®* 和 Apache Spark™ 叢集。

使用 Data Proc,您可以管理叢集大小和節點容量,並配合使用各種 Apache® 服務,例如 Spark、HDFS、YARN、Hive、HBase、Oozie、Sqoop、Flume、Tez 和 Zeppelin。

Apache Hadoop 用於儲存和分析結構化和非結構化大資料。

Apache Spark 是一種快速資料處理工具,可以與 Apache Hadoop 和其他儲存系統整合。

使用運算子

要了解如何使用 Data Proc 運算子,請參閱示例 DAGs

此條目有用嗎?