10分鍾教程:在Databricks上開始機器學習

本文中的筆記本旨在讓您快速開始使用Databricks進行機器學習。你可以導入每一個筆記本到你的Databricks工作空間運行它們。

這些筆記本說明了如何在機器學習的整個生命周期中使用Databricks,包括數據加載和準備;模型訓練、調優和推斷;和模型部署和管理。它們還展示了一些有用的工具,比如Hyperopt對於自動超參數調整,MLflow跟蹤以及用於模型開發的自記錄模型注冊模型管理。

scikit-learn筆記本

筆記本

需求

特性

機器學習快速入門

Databricks Runtime 7.5 ML或以上

分類模型,MLflow, Hyperopt和MLflow超參數自動調優

機器學習與模型注冊表

磚運行時毫升

分類模型,MLflow,自動超參數調優與Hyperopt和MLflow,模型注冊

的端到端示例

磚運行時毫升

分類模型,MLflow, Hyperopt和MLflow超參數自動調優,XGBoost,模型注冊,模型服務

Apache Spark MLlib筆記本

筆記本

需求

特性

使用MLlib進行機器學習

Databricks Runtime 7.3 LTS ML或以上

邏輯回歸模型,Spark流水線,MLlib API自動超參數調優

深度學習筆記本

筆記本

需求

特性

使用TensorFlow Keras進行深度學習

Databricks Runtime 7.3 ML或以上

神經網絡模型,內聯TensorBoard,使用Hyperopt和MLflow自動超參數調優,自動日誌,ModelRegistry