MLFLOW指南

MLFLOW是管理端到端機器學習生命周期的開源平Beplay体育安卓版本台。它具有以下主要組件:

  • 跟蹤:允許您跟蹤實驗記錄和比較參數和結果。

  • 模型:允許您管理和部署從各種ML庫中的模型到各種模型服務和推理平台。Beplay体育安卓版本

  • 項目:允許您以可重複使用的可重複形式包裝ML代碼,與其他數據科學家共享或轉移到生產。

  • 模型注冊表:允許您集中一個模型存儲,用於管理模型的完整生命周期階段過渡:從分期到生產,具有版本控製和注釋的功能。

  • 模型服務:允許您將MLFLOW模型作為REST端點托管。

MLFlow支持爪哇,,,,Python,,,,r, 和休息蜜蜂。

Databricks提供了與企業安全功能,高可用性以及其他Databricks Workspace功能(例如實驗和運行管理和筆記本修訂版)集成的MLFLOW的完全管理和托管版本。Databricks上的MLFLOW提供了用於跟蹤和確保機器學習模型培訓和運行機器學習項目的集成體驗。

如果您剛剛開始使用Databricks,請考慮使用MLFlowDatabricks社區版,它為輕量級實驗提供了簡單的托管MLFlow體驗。Databricks社區版本不支持MLFLOW項目的遠程執行。我們計劃對實驗和運行的數量施加適度的限製。為了在Databricks社區版本上首次啟動MLFlow,沒有施加限製。

使用平台管理的密鑰對控製平麵中存儲的MLFlow數據(實驗運行,指標,標簽和參數)是加密的。Beplay体育安卓版本使用加密客戶管理的托管服務鑰匙不支持該數據。另一方麵,可以通過配置客戶管理的鍵以用於工作空間存儲,可以使用自己的密鑰加密存儲在您的根中(DBFS存儲)中的MLFLOW模型和工件。

首次用戶應該從快速開始,演示基本的MLFLOW跟蹤API。隨後的文章通過示例筆記本介紹了每個MLFlow組件,並描述這些組件如何在Databrick中托管。