관리형mlflow

管理完整的機器學習生命周期

무료시험판사용보기데모예약

什麼是托管MLFlow?

托管MLFlow建立在MLFLOW,由Databricks開發的開源Beplay体育安卓版本平台,可幫助管理具有企業可靠性,安全性和規模的完整機器學習生命周期。

장점

實驗跟蹤

使用任何ML庫,框架或語言進行實驗,並自動跟蹤每個實驗中的參數,指標,代碼和模型。通過在Databricks上使用MLFlow,您可以安全地共享,管理和比較實驗結果以及相應的工件和代碼版本,這要歸功於與Databricks Workspace和筆記本電腦內置集成。

模型管理

使用一個中心地點發現和共享ML模型,合作將其從實驗轉移到在線測試和生產,與批準和治理工作流程以及CI/CD管道集成,並監視ML部署及其性能。這MLFlow模型注冊表促進分享專業知識和知識,並幫助您保持控製。

模型部署

快速在Apache Spark™上使用與Docker容器,Azure ML或Amazon Sagemaker的內置集成來快速部署用於批處理推斷或作為REST API的生產模型。使用Databricks上的托管MLFlow,您可以使用Databricks作業調度程序和自動管理的群集來操作和監視生產模型,以根據業務需求進行擴展。

特征

MLFLOW跟蹤

MLFlow跟蹤:自動使用每次運行的參數,代碼版本,指標和工件Python,,,,休息,,,,R API, 和Java API

MLFlow跟蹤服務器:使用內置跟蹤服務器快速入門,以在一個地方記錄所有運行和實驗。Databricks不需要配置。

實驗管理:通過訪問控製和搜索查詢,創建,安全,組織,搜索和可視化實驗。

MLFlow Run側欄:自動從筆記本電腦內部跟蹤運行,並為每次運行捕獲筆記本的快照,以便您始終返回代碼的先前版本。
使用運行來記錄數據:日誌參數,數據集,指標,工件等等,以運行到本地文件,到sqlalchemy兼容數據庫或遠程到跟蹤服務器。

三角洲湖的整合:跟蹤大規模數據集,這些數據集為您的模型提供了Delta Lake快照。

文物商店:在Amazon S3,Azure Blob存儲,Google Cloud Storage,SFTP Server,NFS和本地文件路徑中存儲大型文件,例如S3存儲桶,共享NFS文件係統和模型。

MLFlow項目

MLFLOW項目:MLFlow項目允許指定軟件環境這用於執行您的代碼。MLFlow當前支持以下項目環境:Conda環境,Docker容器環境和係統環境。任何GIT存儲庫或本地目錄都可以視為MLFLOW項目。

遠程執行模式:MLFlow項目從GIT或本地資源從數據鏈球群上遠程來源,使用Databricks CLI快速擴展您的代碼。

MLFlow模型注冊表

中央存儲庫:注冊MLFlow模型MLFlow模型注冊表。注冊模型具有唯一的名稱,版本,舞台和其他元數據。

模型版本:更新時會自動跟蹤注冊型號的版本。

模型階段:分配給每個模型版本的預設或自定義階段,例如“分期”和“生產”,以表示模型的生命周期。

CI/CD工作流集成:記錄階段過渡,請求,審查和批準更改,作為CI/CD管道的一部分,以更好地控製和治理。

模型階段過渡:將新的注冊事件或更改記錄為自動記錄用戶,更改和其他元數據(例如評論)的活動。

MLFLOW模型

MLFLOW模型:包裝機學習模型的標準格式,可用於各種下遊工具,例如,通過REST API進行實時服務或Apache Spark上的批處理推斷。

模型自定義:采用自定義Python型號自定義口味對於ML庫中的模型,該模型不受MLFlow的內置口味明確支持。

內置模型口味:MLFlow提供了幾種標準口味,這些口味可能在您的應用程序中很有用,例如Python和R Functions,H20,Keras,Mleap,Pytorch,Scikit-Learn,Spark Mllib,Tensorflow和Onnx。內置部署工具:快速通過Apache Spark UDF,本地計算機或其他幾個生產環境(例如Microsoft Azure ML,Amazon Sagemaker和構建用於部署的Docker圖像

從Azure Databricks和AWS查看我們的產品新聞,以了解有關我們最新功能的更多信息。

比較MLFlow產品

這個怎麼運作

MLFLOW是一組輕巧的API和用戶界麵,可以在整個機器學習工作流程中與任何ML框架一起使用。它包括四個組件:MLFLOW跟蹤,,,,MLFLOW項目,MLFLOW模型MLFlow模型注冊表

MLFLOW跟蹤:記錄和查詢實驗:代碼,數據,配置和結果。

MLFlow項目:用於可再現的包裝格式在任何平台上運行。Beplay体育安卓版本

MLFLOW模型:用於將模型發送到各種部署工具的通用格式。

MLFlow模型注冊表:集中存儲庫,以在整個生命周期中協作管理MLFlow模型beplay娱乐ios。

Databricks上的MLFLOW是MLFLOW的完全管理版本,可為實踐者提供跨數據串筆記本,作業和數據存儲的可重複性和實驗管理,並具有可靠性,安全性和可擴展性統一數據分析平台Beplay体育安卓版本

리소스