描述
在本課程中,您將學習使用MLFlow管理機器學習實驗和模型的最佳實踐。本課程中有兩個主要組成部分:(i)使用MLFlow跟蹤機器學習生命周期,部署的軟件包模型以及管理模型版本(ii)檢查各種生產問題,不同的部署範式和後期製作問題。在本課程結束時,您將建立一條端到端管道來記錄,部署和監視機器學習模型。
本課程將為您準備Databricks認證的機器學習專業考試。
期間
1整天或2天
目標
- 跟蹤,版本和管理機器學習實驗
- 利用Databricks功能商店用於可重複的數據管理
- 實施用於部署批處理,流和實時模型的策略
- 構建監視解決方案,包括漂移檢測
先決條件
- Python和Pandas的中級經驗
- 機器學習和數據科學的工作知識(Scikit-Learn,TensorFlow等)
- 熟悉Apache Spark
大綱
第一天
- ML生產概述
- 帶有Delta和Databricks功能商店的數據管理
- 通過MLFlow跟蹤進行實驗跟蹤和版本控製
- 具有MLFLOW模型和模型注冊表的模型管理
- 使用Webhooks自動測試
- 部署範式
- 監視和CI/CD
即將舉行的公共課程
如果您有任何疑問,請參考我們經常問的問題頁。