跳轉到主要內容
工程的博客

MLflow 0.2發布

2018年7月3日, 工程的博客

分享這篇文章

在今年的火花+人工智能峰會,我們介紹了MLflow機器學習,一個開源的平台來簡化生命Beplay体育安卓版本周期。在發布以來的3周,我們已經看到了很多的興趣數據的科學家和工程師在使用和MLflow做出貢獻。MLFlow的GitHub庫已經有180個叉,十幾個貢獻者和拉請求已經提交問題。此外,近100人來到我們的第一個MLflow聚會上周。

今天,我們很高興宣布MLflow v0.2,我們幾天前公布的一些最要求的特性與內部客戶和開源的用戶。如果你MLflow 0.2已經可用pip安裝mlflow中描述的那樣MLflow快速入門指南。在這篇文章中,我們將討論的主要新特性。

內置TensorFlow集成

MLflow便於培訓和服務模型從任何機器學習庫,隻要你可以包裝在一個Python函數,但對於非常常用的庫,我們想提供內置支持。在這個版本中,我們增加了mlflow.tensorflow包,這使得它容易日誌TensorFlow MLflow跟蹤模型。一旦你登錄一個模型這種方式,您可以立即將其傳遞給所有的部署工具已經支持MLflow(例如本地其他服務器、Azure毫升服務或Apache火花批推理)。

下麵的例子顯示了用戶可以登錄特遣部隊訓練模型和使用pyfunc抽象使用內置的功能來部署它。

培訓環境:保存特遣部隊訓練模型

#保存SavedModel格式的估計量。estimator_path = your_regressor。export_savedmodel (model_dir receiver_fn)#日誌導出SavedModel MLflow。# signature_def_key:簽名的名稱定義計算#當加載SavedModel推理#裁判:(https://www.tensorflow.org/serving/signature_defs)。# artifact_path:路徑(根據工件目錄為當前運行)#模型將被保存為一個工件。mlflow.tensorflow.log_saved_model (saved_model_dir = estimator_path,signature_def_key =“預測”,artifact_path =“模型”)

部署環境:負載救了TF模型和預測

生產跟蹤服務器

在MLflow 0.2中,我們添加了一個新的mlflow服務器命令啟動生產版本的MLflow跟蹤服務器跟蹤和查詢實驗。與當地的mlflow ui命令,mlflow服務器可以支持多個工作線程和S3-backed存儲如下所述。你可以閱讀學習的MLflow文檔如何運行跟蹤服務器

S3-Backed工件存儲

MLflow的關鍵特性之一是日誌的輸出訓練跑步,這可以包括任意文件稱為“工件。“然而,MLflow的第一個版本僅支持日誌構件共享POSIX文件係統。在MLflow 0.2中,我們添加了支持在S3中存儲工件,通過——artifact-root參數mlflow服務器命令。這使它容易多個雲實例上運行MLflow培訓工作並跟蹤結果。下麵的例子顯示了如何啟動跟蹤服務器與S3工件存儲。

一個EC2實例上運行MLflow服務器:

%主機名ec2-11年-222年-333年-444年。我們- - - - - -西2。compute.amazonaws.com%mlflow服務器\——文件存儲/ mnt /存在於磁盤上/ mlflow_data \——artifact-root s3: / / my-mlflow-bucket /

MLflow客戶:

mlflow.set_tracking_uri (“http://ec2 - 11 - 222 - 333 - 444. - 2. -西方- compute.amazonaws.com”)mlflow.start_run ():mlflow.log_parameter (“x”,1)mlflow.log_metric (“y”,2)mlflow.log_artifact (“/ tmp /模式”)

其他改進

除了這些大的特性,一些bug修複和文檔都包含在這個版本。可以找到變化的完整列表在更新日誌。我們歡迎更多的輸入(電子郵件保護)或通過申請的問題提交補丁在GitHub上。關於MLflow實時問題,我們最近還創建了一個鬆弛的通道MLflow。

MLflow接下來是什麼?

我們計劃繼續更新MLflow迅速的α。例如,我們正在進行的工作包括內置集成更多的庫(如PyTorch Keras和MLlib)和進一步改進跟蹤服務器的可用性。為我們下一步工作的概述,看看我們的路線圖的幻燈片演講從上周的聚會或看meetup演講

磚用戶想試試MLflow的托管版本,我們也接受注冊www.eheci.com/mlflow

學分

從亞倫戴維森MLflow 0.2包括補丁,安德魯·陳安迪Konwinski,大衛·馬修斯丹尼李,鑫山,Joel Akeret Jules Damji Juntai鄭,賈斯汀奧爾森,摩尼Parkhe,曼努埃爾·加裏多馬泰Zaharia米開朗基羅D \ ' agostino博士Ndjido Ardo酒吧,彭宇,哈斯默奇,Stephanie Bodoff Tingfan吳,托馬斯Nykodym,雪玉

免費試著磚
看到所有工程的博客的帖子
Baidu
map