在Databricks上使用Apache Spark MLlib

Apache Spark MLlib是Apache Spark機器學習庫,由常見的學習算法和實用程序組成,包括分類、回歸、聚類、協同過濾、降維和底層優化原語。beplay娱乐iosDatabricks推薦以下Apache Spark MLlib指南:

例如筆記本電腦

下麵的筆記本演示如何使用Databricks使用各種Apache Spark MLlib特性。

二元分類實例

本筆記本向您展示如何使用Apache Spark MLlib管道API構建二進製分類應用程序。

二進製分類筆記本

在新標簽頁打開筆記本

決策樹示例

這些示例演示了使用Apache Spark MLlib pipeline API的決策樹的各種應用程序。

決策樹

這些筆記向您展示如何使用決策樹進行分類。

數字識別筆記本的決策樹

在新標簽頁打開筆記本

SFO調查筆記本的決策樹

在新標簽頁打開筆記本

使用MLlib管道進行GBT回歸

本筆記本向您展示了如何使用MLlib管道執行回歸,使用梯度增強樹從諸如星期幾、天氣、季節等信息預測自行車租賃數量(每小時)。

共享單車回歸筆記本

在新標簽頁打開筆記本

Apache Spark MLlib管道和結構化流示例

這本筆記本展示了如何在曆史數據上訓練Apache Spark MLlib管道,並將其應用於流數據。

MLlib管道結構化流筆記本

在新標簽頁打開筆記本

Advanced Apache Spark MLlib示例

這本筆記本說明了如何創建一個自定義轉換器。

定製變壓器筆記本

在新標簽頁打開筆記本

關於MLlib特性的參考信息,Databricks推薦以下Apache Spark API參考:

關於從R使用Apache Spark MLlib,請參見機器學習文檔。

有關Databricks對可視化機器學習算法的支持,請參見機器學習可視化