跳轉到主要內容
工程的博客

宣布MLflow 1.0版本

分享這篇文章

MLflow是一個開源的平台來幫助管理機器學習的Beplay体育安卓版本完整生命周期。MLflow,數據科學家可以跟蹤和分享實驗在本地(在筆記本電腦上)或遠程(雲),包和跨框架,共享模型和部署模型幾乎任何地方。

今天我們興奮地宣布MLflow 1.0的發布。自一年前推出以來,MLflow已經部署在成千上萬的組織來管理他們的生產機器學習工作負載,並已成為普遍可用的服務管理MLflow磚上。MLflow已發展到100多個貢獻者社區,和MLflow PyPI包下載速度已經達到了接近600 k乘以一個月。1.0版不僅標誌著成熟和穩定的api,還添加了許多經常請求的特性和改進。

發布公開從今天開始。安裝使用PyPl MLflow 1.0,讀我們的文檔開始,並提供反饋GitHub。下麵我們描述幾個MLflow 1.0中的新特性。請參考發布說明為一個完整的列表。

有什麼新的MLflow 1.0

支持X坐標跟蹤API

數據科學家和工程師跟蹤指標在ML訓練通常要麼想跟蹤總結度量的訓練,例如,準確性,或“流指標”產生在模型訓練,例如,每mini-batch損失。那些流指標通常是計算每個mini-batch或時代的訓練數據。使準確記錄這些指標,以及更好的可視化log_metricAPI現在支持一步參數。

mlflow。log_metric(價值,關鍵步驟=沒有一個)

度量步驟可以是任意整數表示度量的x坐標。例如,如果你想要記錄每個時代的度量數據,該步驟將是時代的數字。

MLflow UI現在還支持策劃指標對提供x坐標值。在下麵的示例中,我們將展示如何可以使用UI對walltime可視化兩個指標。盡管他們在不同的時間點記錄偏差(如圖所示的“相對時間”視圖中的數據點),數據點與相同的x坐標。通過切換到“步驟”視圖中可以看到,兩指標排隊數據點的x坐標的值。

玩這個視頻,請點擊這裏,接受餅幹

改進的搜索功能

改善搜索功能,搜索過濾器API現在支持一個簡化版的SQL WHERE子句。此外,它已經被運行屬性增強,支持搜索和標簽除了指標和參數。下麵的例子顯示了運行在所有的實驗參數的搜索和標簽值。

mlflow.tracking.client進口MlflowClientall_experiments = [exp.experiment_id經驗值.list_experiments MlflowClient () ())
              運行= (MlflowClient ().search_runs (experiment_ids = all_experiments,filter_string =”參數。模型=《盜夢空間》和tags.version = resnet”run_view_type = ViewType.ALL))

批處理日誌記錄的指標

在實驗中要記錄多個指標,通常是更方便,性能日誌作為一個批處理,而不是個人。MLflow 1.0包括一個運行/ log-batchREST API端點為日誌記錄多個指標、參數和標簽與單個API請求。

你可以稱之為batched-logging端點從:

  • Python
    mlflow。log_metrics mlflow。log_params, mlflow.set_tags
  • R
    mlflow_log_batch
  • Java
    MlflowClient.logBatch

HDFS支持工件存儲

除了本地文件,MLflow已經支持以下存儲係統,工件商店:Amazon S3, Azure Blob存儲,穀歌雲存儲,SFTP和NFS。MLflow 1.0版本,我們添加對HDFS的支持工件存儲後端。簡單地指定一個hdfs: / /URI與——backend-store-uri:

hdfs:/ / <主機>:<口> / <路徑> < /路徑> < /端口> < /主機>

Windows支持MLflow客戶機

MLflow運行在Windows操作係統上的用戶現在可以跟蹤實驗MLflow 1.0 Windows客戶端。

為部署建立碼頭工人的照片

部署毫升模型的最常見的方法之一是建立一個碼頭工人容器。MLflow 1.0增加了一個新命令來構建一個碼頭工人容器的默認入口點是指定MLflow pyfunc模型容器內的端口8080。例如,您可以建立一個碼頭工人容器和在端口5001上的主機服務這些命令:

mlflow build-docker - m模型“運行:/ some-run-uuid /我的模型”- n“my-image-name”碼頭工人運行- p5001年:8080年“my-image-name”

ONNX模型味道

此版本增加了一個實驗ONNX模型的味道。記錄ONNX MLflow格式的模型,使用mlflow.onnx.save_model ()mlflow.onnx.log_model ()方法。這些方法也增加pyfunc味道他們生產的MLflow模型,使模型被視為通用推理通過Python函數mlflow.pyfunc.load_pyfunc ()。的pyfunc表示MLflow ONNX模型使用ONNX運行時執行引擎進行評估。最後,您可以使用mlflow.onnx.load_model ()方法加載MLflow模型與ONNX本機ONNX格式的味道。

其他功能和更新

注意,這個主要版本發布包括一些無法兼容的改變。請查看完整列表的變化和社區的貢獻1.0發行說明。我們歡迎更多的輸入(電子郵件保護)或提出問題或提交補丁在GitHub上。實時MLflow問題外,我們還經營鬆弛的通道MLflow,你可以遵循@MLflow在Twitter上。

1.0之後的下一個什麼

1.0版是一個裏程碑MLflow組件已廣泛采用:跟蹤模型和項目。當我們繼續開發這些組件,我們也投資於新組件覆蓋更多的ML生命周期。下一個主要除了MLflow將注冊表模型,允許用戶管理自己的ML模式的生命周期從實驗到部署和監控。看記錄在MLflow火花AI峰會的主題即將到來的演示功能。

不要錯過我們即將舉行的研討會中,我們將討論1.0更新和更多:機器學習生命周期管理:有什麼新的MLflow周四,6月6日。

最後,加入我們的海灣地區MLflow Meetup由微軟在森尼維耳市周四6月20日。注冊在這裏

閱讀更多

開始MLflow在你的筆記本電腦或磚,您可以:

  1. 讀了快速入門指南
  2. 通過工作教程
  3. 試管理MLflow磚上

學分

我們想要感謝下列貢獻者更新,doc變化,和貢獻在MLflow 1.0:亞倫·戴維森,亞曆山大•Shtuchkin Anca Sarb,安德魯·陳安德魯牧杖,安東尼,基督教的老人,克萊門斯Mewald,科裏Zumar, Derron胡錦濤,麥當勞,伽伯利普達克,吉姆·湯普森,凱文•郭Kublai-Jing,盧克朱,摩尼Parkhe,馬泰Zaharia保羅•Ogilive理查德•藏肖恩·歐文,哈斯默奇,斯蒂芬妮Bodoff,安蘇,Sungjun Kim托馬斯Nykodym, Yahro,約裏克,avflor, eedeleon, freefrag, hchiuzhuo, jason-huling, kafendt vgod-dbx。

免費試著磚
看到所有工程的博客的帖子
Baidu
map