Apache Spark簡介

該自節奏指南是使用數據映射的Apache Spark的“ Hello World”教程。在以下教程模塊中,您將學習創建Spark作業,加載數據並使用數據的基礎知識。您還將介紹運行機器學習算法並處理流數據。Databricks允許您立即開始編寫Spark查詢,因此您可以專注於數據問題。

在側邊欄和此頁麵上,您可以看到五個教程模塊,每個教程模塊代表Databricks上Apache Spark的過程中的一個階段。這些模塊中的每個模塊都指獨立的用法方案,並帶有現成的筆記本和預加載數據集;如果您對基礎知識感到滿意,可以跳起來。