跟蹤模型開發

模型開發過程是迭代的,它可能是一個挑戰來跟蹤你的工作當您開發和優化模型。在磚,你可以使用MLflow跟蹤幫助你跟蹤模型的開發過程,包括參數設置或組合你有試過和他們如何影響模型的性能。

MLflow跟蹤使用實驗運行日誌和跟蹤您的模型的發展。跑步是一個單一的執行模型代碼。一個MLflow運行期間,您可以登錄模型參數和結果。一個實驗是相關的集合。在一個實驗中,可以比較和過濾器運行了解您的模型執行以及其性能取決於參數設置,輸入數據,等等。

本文中的筆記本電腦提供簡單的例子,可以幫助您快速開始使用MLflow跟蹤您的模型的發展。為更多的細節在磚使用MLflow跟蹤,看看跟蹤機器學習培訓

請注意

MLflow提交和跟蹤不支持工作spark_submit_taskAPI的工作。相反,您可以使用MLflow項目火花運行代碼。

用autologging跟蹤模型的發展

MLflow可以自動日誌訓練許多毫升框架編寫的代碼。這是最簡單的方法開始使用MLflow跟蹤。

這個例子筆記本顯示了如何使用autologgingscikit-learn。autologging其他Python庫的信息,請參閱自動日誌訓練運行MLflow

Python筆記本MLflow autologging快速入門

在新標簽頁打開筆記本

使用日誌API跟蹤模型的發展

這個筆記本演示了如何使用MLflow日誌API。使用日誌記錄API給你更多的控製指標和讓你日誌記錄附加的構件(如表或情節。

這個例子筆記本顯示如何使用Python日誌API。MLflow也休息,R, Java api

Python筆記本MLflow日誌API快速入門

在新標簽頁打開筆記本

的端到端示例

本教程的筆記本提供了一個端到端在磚訓練模型的例子,包括裝載數據,可視化數據,建立一個並行hyperparameter優化,並利用MLflow審查結果,注冊模型,對新數據進行推理火花UDF使用注冊模型。

需求

磚運行時毫升

例如筆記本電腦

請注意

以下的筆記本可能包括功能不可用這個版本的磚在穀歌的雲。

MLflow的端到端示例筆記本

在新標簽頁打開筆記本