機器學習和深度學習環境設置指南

用於機器學習的Databricks運行時(Databricks Runtime ML)是一種針對機器學習和數據科學優化的現成環境。DataBricks運行時ML包括許多外部庫,包括Tensorflow,Pytorch,Horovod,Scikit-Learn和Xgboost,並提供擴展以提高性能,包括GPU加速xgboost,使用Horovodrunner,以及使用一個模型檢查點Databricks文件係統(DBFS)保險絲安裝座

要使用Databricks運行時ML,請選擇運行時的ML版本創建您的群集

安裝其他庫

您可以安裝其他為您的筆記本或群集創建自定義環境。

創建啟用GPU的群集

您可以創建啟用GPU的集群以加速深度學習任務。有關創建GPU啟用Databricks群集的信息,請參閱啟用GPU的群集。Databricks運行時ML包括GPU硬件驅動程序和NVIDIA庫,例如CUDA。