在Databricks上使用Apache Spark MLlib
Apache Spark MLlib是Apache Spark機器學習庫,由常見的學習算法和實用程序組成,包括分類、回歸、聚類、協同過濾、降維和底層優化原語。beplay娱乐iosDatabricks推薦以下Apache Spark MLlib指南:
例如筆記本電腦
下麵的筆記本演示如何使用Databricks使用各種Apache Spark MLlib特性。
二元分類實例
本筆記本向您展示如何使用Apache Spark MLlib管道API構建二進製分類應用程序。
決策樹示例
這些示例演示了使用Apache Spark MLlib pipeline API的決策樹的各種應用程序。
Apache Spark MLlib管道和結構化流示例
這本筆記本展示了如何在曆史數據上訓練Apache Spark MLlib管道,並將其應用於流數據。
Advanced Apache Spark MLlib示例
這本筆記本說明了如何創建一個自定義轉換器。
關於MLlib特性的參考信息,Databricks推薦以下Apache Spark API參考:
關於從R使用Apache Spark MLlib,請參見機器學習文檔。
有關Databricks對可視化機器學習算法的支持,請參見機器學習可視化.