這就跟你問聲好!任何幫助將不勝感激!
所以我本教程:https://docs.www.eheci.com/applications/mlflow/projects.html。
我決定用一個文件夾DBFS包含我的MLflow項目細節。所以,在我的項目有:
MLproject:
conda_env: / dbfs / FileStore / shared_uploads /(電子郵件保護)/ wineTest / conda。yaml entry_points:主要參數:n_estimators:{類型:int,默認值:0.5}命令:“python3 / dbfs / FileStore / shared_uploads /(電子郵件保護)/ wineTest /火車。py {n_estimators}”
conda.yaml
名稱:mlflow-env渠道:conda-forge依賴性:python = 3.8.10 -脈衝-脈衝:- mlflow熊貓= = 4 - psutil = = 5.8.0 scikit-learn = = 0.24.1 - typing-extensions = = 3.7.4.3 xgboost = = 1.5.2
火車。py(代碼取自這筆記本:https://docs.www.eheci.com/_static/notebooks/mlflow/mlflow-end-to-end-example.html
[我基本上複製細胞到一個. py的文件中。對不起,太長,包括這裏的代碼。)
然後為我的集群規範,我有這段代碼:
{" new_cluster ": {“spark_version”:“9.1.x-cpu-ml-scala2.12”、“num_workers”: 2,“node_type_id”:“Standard_DS3_v2”},“庫”:[{“pypi”:{“包”:“dbfs / FileStore / shared_uploads /(電子郵件保護)/ requests-2.28.1-py3-none-any。”whl}}, ....(47其他包的格式相同)
所以我到步驟3在本教程中,我得到這個:
當我去實驗在步驟1中,沒有什麼比步驟4中列出。
我確信我的錯誤在我的文件夾包含部分的項目,但我不知道我做錯了什麼。我是一個新來的磚和編寫代碼。任何幫助將大大讚賞。非常感謝你的時間和幫助!