什麼是AutoML?

Databricks AutoML幫助您自動將機器學習應用到數據集。您提供數據集並識別預測目標,而AutoML為模型訓練準備數據集。然後AutoML執行並記錄一組創建、調優和評估多個模型的試驗。在模型評估之後,AutoML將顯示結果,並提供一個Python筆記本,其中包含每次試運行的源代碼,以便您可以檢查、再現和修改代碼。AutoML還計算數據集的彙總統計信息,並將這些信息保存在筆記本中,以便您稍後查看。

您可以使用Databricks AutoML來處理回歸、分類和預測問題。了解更多關於Databricks AutoML是如何工作的

需求

  • Databricks Runtime 9.1 ML或以上版本。對於通用可用性(GA)版本,請使用Databricks Runtime 10.4 LTS ML或以上版本。

    • 對於時間序列預測,使用Databricks Runtime 10.0 ML或以上版本。

    • 對於Databricks Runtime 9.1 LTS ML及以上版本,AutoML依賴於databricks-automl-runtime包,它包含在AutoML之外有用的組件,還有助於簡化AutoML培訓生成的筆記本。databricks-automl-runtime可在PyPI

  • 除了在Databricks運行時for Machine Learning中預安裝的庫之外,不應該在集群上安裝其他庫。

    • 對現有庫版本的任何修改(刪除、升級或降級)都會由於不兼容而導致運行失敗。

  • 在一個高並發集群, AutoML不兼容表訪問控製憑據透傳

  • 使用統一目錄和AutoML一起集群接入模式必須單用戶,您必須是集群的指定單用戶。