集群庫
集群庫可以被運行在集群上的所有筆記本使用。您可以使用以前安裝的工作區庫或使用init腳本直接從公共存儲庫(如PyPI或Maven)安裝集群庫。
在集群上安裝庫
在集群上安裝庫主要有兩種方法:
安裝一個工作區圖書館已經上傳到工作區。
安裝僅用於特定集群的庫。
此外,如果庫需要自定義配置,則可能無法使用上麵列出的方法安裝它。相反,您可以使用init腳本它在創建集群時運行。
方法之外,還可以在集群上安裝庫磚起程拓殖的提供者而且databricks_library.
在本節中:
工作區圖書館
請注意
從Databricks Runtime 7.2開始,Databricks按照安裝在集群上的順序處理所有工作區庫。在Databricks Runtime 7.1及以下版本上,Databricks按照Maven和CRAN庫安裝在集群上的順序處理它們。
如果庫之間存在依賴關係,您可能需要注意集群上的安裝順序。
要安裝工作空間中已經存在的庫,可以從集群UI或庫UI開始:
Cluster-installed圖書館
可以在特定集群上安裝庫,而不將其作為工作空間庫使用。
在集群上安裝庫。
點擊計算在側邊欄。
單擊集群名稱。
單擊庫選項卡。
點擊安裝新.
創建對象的方法之一工作區圖書館.你點擊後創建,庫已安裝在集群上。
查看集群上安裝的庫
點擊計算在側邊欄。
單擊集群名稱。
單擊庫選項卡。對於每個庫,選項卡顯示名稱和版本、類型、安裝狀態,如果上傳,則是源文件。