MLflow實驗

MLflow實驗數據源提供一個標準API加載MLflow實驗運行數據。你可以加載數據筆記本的實驗,或者您可以使用MLflow實驗實驗名稱或ID。

需求

磚運行時6.0毫升以上。

從筆記本實驗加載數據

從筆記本數據加載實驗,使用load ()

df=火花格式(“mlflow-experiment”)負載()顯示(df)
瓦爾df=火花格式(“mlflow-experiment”)。負載()顯示(df)

使用實驗id加載數據

加載數據從一個或多個工作空間實驗,實驗指定id如圖所示。

df=火花格式(“mlflow-experiment”)負載(“3270527066281272”)顯示(df)
瓦爾df=火花格式(“mlflow-experiment”)。負載(“3270527066281272,953590262154175”)顯示(df)

加載數據使用實驗名稱

你也可以通過實驗的名字load ()方法。

expId=mlflowget_experiment_by_name(“/共享/ diabetes_experiment /”)experiment_iddf=火花格式(“mlflow-experiment”)負載(expId)顯示(df)
瓦爾expId=mlflowgetExperimentByName(“/共享/ diabetes_experiment /”)。得到getExperimentId瓦爾df=火花格式(“mlflow-experiment”)。負載(expId)顯示(df)

過濾數據基於指標和參數

本節中的示例展示了如何從一個實驗後過濾數據加載它。

df=火花格式(“mlflow-experiment”)負載(“3270527066281272”)filtered_df=df過濾器(”指標。損失< 0.01和參數。learning_rate > 0.001”)顯示(filtered_df)
瓦爾df=火花格式(“mlflow-experiment”)。負載(“3270527066281272”)瓦爾filtered_df=df過濾器(”指標。損失< 1.85和參數。num_epochs > 30”)顯示(filtered_df)

模式

數據源返回的DataFrame的模式是:

|——run_id:字符串|——experiment_id:字符串|——指標:地圖||——關鍵:字符串||——價值:|——參數個數:地圖||——關鍵:字符串||——價值:字符串|——標簽:地圖||——關鍵:字符串||——價值:字符串|——start_time:時間戳|——end_time:時間戳|——狀態:字符串|——artifact_uri:字符串