宣布MLflow 1.0版本
2019年6月6日 在工程的博客
MLflow是一個開源的平台來幫助管理機器學習的Beplay体育安卓版本完整生命周期。MLflow,數據科學家可以跟蹤和分享實驗在本地(在筆記本電腦上)或遠程(雲),包和跨框架,共享模型和部署模型幾乎任何地方。
今天我們興奮地宣布MLflow 1.0的發布。自一年前推出以來,MLflow已經部署在成千上萬的組織來管理他們的生產機器學習工作負載,並已成為普遍可用的服務管理MLflow磚上。MLflow已發展到100多個貢獻者社區,和MLflow PyPI包下載速度已經達到了接近600 k乘以一個月。1.0版不僅標誌著成熟和穩定的api,還添加了許多經常請求的特性和改進。
發布公開從今天開始。安裝使用PyPl MLflow 1.0,讀我們的文檔開始,並提供反饋GitHub。下麵我們描述幾個MLflow 1.0中的新特性。請參考發布說明為一個完整的列表。
有什麼新的MLflow 1.0
支持X坐標跟蹤API
數據科學家和工程師跟蹤指標在ML訓練通常要麼想跟蹤總結度量的訓練,例如,準確性,或“流指標”產生在模型訓練,例如,每mini-batch損失。那些流指標通常是計算每個mini-batch或時代的訓練數據。使準確記錄這些指標,以及更好的可視化log_metric
API現在支持一步參數。
mlflow。log_metric(價值,關鍵步驟=沒有一個)
度量步驟可以是任意整數表示度量的x坐標。例如,如果你想要記錄每個時代的度量數據,該步驟將是時代的數字。
MLflow UI現在還支持策劃指標對提供x坐標值。在下麵的示例中,我們將展示如何可以使用UI對walltime可視化兩個指標。盡管他們在不同的時間點記錄偏差(如圖所示的“相對時間”視圖中的數據點),數據點與相同的x坐標。通過切換到“步驟”視圖中可以看到,兩指標排隊數據點的x坐標的值。
改進的搜索功能
改善搜索功能,搜索過濾器API現在支持一個簡化版的SQL WHERE子句。此外,它已經被運行屬性增強,支持搜索和標簽除了指標和參數。下麵的例子顯示了運行在所有的實驗參數的搜索和標簽值。
從mlflow.tracking.client進口MlflowClientall_experiments = [exp.experiment_id為經驗值在.list_experiments MlflowClient () ())
運行= (MlflowClient ().search_runs (experiment_ids = all_experiments,filter_string =”參數。模型=《盜夢空間》和tags.version = resnet”run_view_type = ViewType.ALL))
批處理日誌記錄的指標
在實驗中要記錄多個指標,通常是更方便,性能日誌作為一個批處理,而不是個人。MLflow 1.0包括一個運行/ log-batch
REST API端點為日誌記錄多個指標、參數和標簽與單個API請求。
你可以稱之為batched-logging端點從:
- Python
mlflow。log_metrics mlflow。log_params, mlflow.set_tags
- R
mlflow_log_batch
- Java
MlflowClient.logBatch
HDFS支持工件存儲
除了本地文件,MLflow已經支持以下存儲係統,工件商店:Amazon S3, Azure Blob存儲,穀歌雲存儲,SFTP和NFS。MLflow 1.0版本,我們添加對HDFS的支持工件存儲後端。簡單地指定一個hdfs: / /
URI與——backend-store-uri
:
hdfs:/ / <主機>:<口> / <路徑> < /路徑> < /端口> < /主機>
Windows支持MLflow客戶機
MLflow運行在Windows操作係統上的用戶現在可以跟蹤實驗MLflow 1.0 Windows客戶端。
為部署建立碼頭工人的照片
部署毫升模型的最常見的方法之一是建立一個碼頭工人容器。MLflow 1.0增加了一個新命令來構建一個碼頭工人容器的默認入口點是指定MLflow pyfunc模型容器內的端口8080。例如,您可以建立一個碼頭工人容器和在端口5001上的主機服務這些命令:
mlflow build-docker - m模型“運行:/ some-run-uuid /我的模型”- n“my-image-name”碼頭工人運行- p5001年:8080年“my-image-name”
ONNX模型味道
此版本增加了一個實驗ONNX模型的味道。記錄ONNX MLflow格式的模型,使用mlflow.onnx.save_model ()
和mlflow.onnx.log_model ()
方法。這些方法也增加pyfunc
味道他們生產的MLflow模型,使模型被視為通用推理通過Python函數mlflow.pyfunc.load_pyfunc ()
。的pyfunc表示MLflow ONNX模型使用ONNX運行時執行引擎進行評估。最後,您可以使用mlflow.onnx.load_model ()
方法加載MLflow模型與ONNX本機ONNX格式的味道。
其他功能和更新
注意,這個主要版本發布包括一些無法兼容的改變。請查看完整列表的變化和社區的貢獻1.0發行說明。我們歡迎更多的輸入(電子郵件保護)或提出問題或提交補丁在GitHub上。實時MLflow問題外,我們還經營鬆弛的通道MLflow,你可以遵循@MLflow在Twitter上。
1.0之後的下一個什麼
1.0版是一個裏程碑MLflow組件已廣泛采用:跟蹤模型和項目。當我們繼續開發這些組件,我們也投資於新組件覆蓋更多的ML生命周期。下一個主要除了MLflow將注冊表模型,允許用戶管理自己的ML模式的生命周期從實驗到部署和監控。看記錄在MLflow火花AI峰會的主題即將到來的演示功能。
不要錯過我們即將舉行的研討會中,我們將討論1.0更新和更多:機器學習生命周期管理:有什麼新的MLflow周四,6月6日。
最後,加入我們的海灣地區MLflow Meetup由微軟在森尼維耳市周四6月20日。注冊在這裏。
閱讀更多
開始MLflow在你的筆記本電腦或磚,您可以:
學分
我們想要感謝下列貢獻者更新,doc變化,和貢獻在MLflow 1.0:亞倫·戴維森,亞曆山大•Shtuchkin Anca Sarb,安德魯·陳安德魯牧杖,安東尼,基督教的老人,克萊門斯Mewald,科裏Zumar, Derron胡錦濤,麥當勞,伽伯利普達克,吉姆·湯普森,凱文•郭Kublai-Jing,盧克朱,摩尼Parkhe,馬泰Zaharia保羅•Ogilive理查德•藏肖恩·歐文,哈斯默奇,斯蒂芬妮Bodoff,安蘇,Sungjun Kim托馬斯Nykodym, Yahro,約裏克,avflor, eedeleon, freefrag, hchiuzhuo, jason-huling, kafendt vgod-dbx。