MLflow指南

MLflow是一個用於管理端到端機器學習生命周期Beplay体育安卓版本的開源平台。它有以下主要組成部分:

  • 跟蹤:允許您跟蹤實驗記錄和比較參數和結果。

  • 模型:允許您管理和部署從各種ML庫到各種模型服務和推斷平台的模型。Beplay体育安卓版本

  • 項目:允許您以可重用、可重複的形式打包ML代碼,以便與其他數據科學家共享或轉移到生產環境中。

  • Model Registry:允許您集中一個模型存儲,用於管理模型的整個生命周期階段轉換:從登台到生產,具有版本控製和注釋的功能。

  • 模型服務:允許您將MLflow模型作為REST端點托管。

Databricks提供了一個完全托管的MLflow版本,集成了企業安全特性、高可用性和其他Databricks工作區特性,如實驗和運行管理以及筆記本修訂捕獲。MLflow on Databricks提供了跟蹤和保護機器學習模型訓練運行和運行機器學習項目的集成體驗。

第一次使用的用戶應該從快速入門,其中演示了基本的MLflow跟蹤api。後續文章將通過示例筆記本介紹每個MLflow組件,並描述如何在Databricks中托管這些組件。

MLflow支持JavaPythonR,休息api。

請注意

如果您剛剛開始使用Databricks,可以考慮使用MLflow on數據庫社區版,它為輕量級實驗提供了一個簡單的托管MLflow體驗。Databricks Community Edition不支持遠程執行MLflow項目。我們計劃對實驗和運行的數量施加適度的限製。對於MLflow在Databricks Community Edition上的初始發布,沒有任何限製。

存儲在控製平麵中的MLflow數據(實驗運行、度量、標記和參數)使用平台管理的密鑰進行加密。Beplay体育安卓版本加密使用用於托管服務的客戶管理密鑰不支持該數據。另一方麵,通過為工作空間存儲配置客戶管理的密鑰,可以使用您自己的密鑰對存儲在根(DBFS)存儲中的MLflow模型和工件進行加密。