在Databricks上使用Apache Spark MLlib

Apache Spark MLlib是Apache Spark機器學習庫，由常見的學習算法和實用程序組成，包括分類、回歸、聚類、協同過濾、降維和底層優化原語。beplay娱乐iosDatabricks推薦以下Apache Spark MLlib指南:

例如筆記本電腦

下麵的筆記本演示如何使用Databricks使用各種Apache Spark MLlib特性。

本節:

本筆記本向您展示如何使用Apache Spark MLlib管道API構建二進製分類應用程序。

這些示例演示了使用Apache Spark MLlib pipeline API的決策樹的各種應用程序。

這些筆記向您展示如何使用決策樹進行分類。

本筆記本向您展示了如何使用MLlib管道執行回歸，使用梯度增強樹從諸如星期幾、天氣、季節等信息預測自行車租賃數量(每小時)。

這本筆記本展示了如何在曆史數據上訓練Apache Spark MLlib管道，並將其應用於流數據。

這本筆記本說明了如何創建一個自定義轉換器。

關於MLlib特性的參考信息，Databricks推薦以下Apache Spark API參考:

關於從R使用Apache Spark MLlib，請參見機器學習文檔。

有關Databricks對可視化機器學習算法的支持，請參見機器學習可視化．