集群庫
集群庫可以被運行在集群上的所有筆記本使用。您可以直接從公共存儲庫(如PyPI或Maven)安裝集群庫,使用以前安裝的工作區庫,或使用init腳本。
在集群上安裝庫
在集群上安裝庫有兩種主要方式:
安裝一個工作區圖書館它已經上傳到工作區。
安裝僅用於特定集群的庫。
此外,如果庫需要自定義配置,則可能無法使用上麵列出的方法安裝它。相反,您可以使用init腳本在創建集群時運行。
方法在集群上安裝庫,除了本文介紹的方法之外Databricks Terraform提供商而且databricks_library.
工作區圖書館
請注意
Databricks按照安裝在集群上的順序處理所有工作區庫。如果庫之間存在依賴關係,則可能需要注意集群上的安裝順序。
要安裝工作區中已經存在的庫,可以從集群UI或庫UI開始:
Cluster-installed圖書館
您可以在特定的集群上安裝庫,而不必將其作為工作區庫使用。
在集群上安裝庫。
點擊計算在側欄中。
單擊集群名稱。
單擊庫選項卡。
點擊安裝新.
創建對象的方法之一工作區圖書館.點擊之後創建時,庫安裝在集群上。
查看集群上安裝的庫
點擊計算在側欄中。
單擊集群名稱。
單擊庫選項卡。對於每個庫,選項卡顯示名稱和版本、類型、安裝狀態,如果上傳,則為源文件。