在Databricks上使用Apache Spark MLlib

Apache Spark MLlib是Apache Spark機器學習庫,由常見的學習算法和實用程序組成,包括分類、回歸、聚類、協同過濾、降維和底層優化原語。beplay娱乐iosDatabricks推薦以下Apache Spark MLLib指南:

例如筆記本電腦

下麵的筆記本演示了如何使用Databricks使用各種Apache Spark MLlib特性。

二進製分類示例

這本筆記本向你展示了如何使用Apache Spark MLlib pipes API構建一個二進製分類應用程序。

二進製分類筆記本

決策樹的例子

這些例子演示了使用Apache Spark MLlib pipeline API的決策樹的各種應用程序。

決策樹

這些筆記本向你展示了如何用決策樹進行分類。

用於數字識別筆記本的決策樹
SFO調查筆記本的決策樹

使用MLlib管道的GBT回歸

這本筆記本向您展示了如何使用MLlib管道使用梯度增強樹執行回歸,從一周的日子、天氣、季節等信息預測自行車租賃計數(每小時)。

共享單車回歸筆記本

Apache Spark MLlib管道和結構化流的例子

這本筆記本展示了如何在曆史數據上訓練Apache Spark MLlib管道,並將其應用到流數據。

MLlib管道結構化流筆記本

Advanced Apache Spark MLlib示例

這本筆記本演示了如何創建一個自定義轉換器。

定製變壓器筆記本

關於MLlib特性的參考信息,Databricks推薦以下Apache Spark API參考:

使用Apache Spark MLlib from R,參見R機器學習文檔。

有關Databricks對可視化機器學習算法的支持,請參見機器學習的可視化