Apache Spark API參考

Databricks建立在Apache Spark的頂部,Apache Spark是一種用於大數據和機器學習的統一分析引擎。有關更多信息,請參閱apache spark-什麼是火花在Databricks網站上。

Apache Spark具有易於使用的API,用於在大型數據集上操作。這包括100多個運營商的集合,用於轉換數據和熟悉的數據框架API,以操縱半結構化數據。這些API包括:

要了解如何在Databricks上使用Apache Spark API,請參見: