創建計算資源
預習
Unity目錄在公共預覽。要參與預覽,請聯係您的數據助理代表。
本文展示了如何創建數據科學與工程或數據鏈機器學習群集或Databricks SQL倉庫,該倉庫可以訪問Unity目錄中的數據。
要求
您的Databricks帳戶必須在高級計劃。
在工作區中,您必須有權創建計算資源。
創建數據科學與工程集群
數據科學與工程集群設計用於運行一般工作負載,例如筆記本電腦。
創建一個可以訪問Unity目錄的數據科學與工程集群:
作為工作區級管理員登錄工作空間。
點擊計算。
點擊創建群集。
輸入集群的名稱。
放Databricks運行時版本至運行時:10.3(Scala 2.12,Spark 3.2.1)或更高。
點擊高級選項。放安全模式至用戶隔離或者單用戶。
用戶隔離簇可以由多個用戶共享,但僅支持SQL工作負載。也禁用了一些高級群集功能,例如庫安裝,init腳本和DBFS保險絲安裝座,以確保群集用戶之間的安全隔離。
要使用那些高級群集功能或語言,或使用Python,Scala和R運行工作負載,請將群集模式設置為單個用戶。單用戶群集還可以運行SQL工作負載。群集可以由單個用戶專門使用(默認情況下,群集的所有者);其他用戶不能將其附加到集群上。自動化作業應在此模式下運行,作業的所有者應該是集群的所有者。在此模式下,視圖安全性無法執行。從視圖中選擇的用戶使用自己的權限執行。
有關每個安全模式中可用功能的更多信息,請參見集群安全模式。
點擊創建群集。
創建數據鏈機器學習群集
Databricks機器學習群集是針對機器學習工作負載的專門構建的。您可以選擇創建一個啟用了GPU的數據鏈機器學習群集。
為了創建一個可以訪問Unity目錄的Databricks機器學習群集:
作為工作區級管理員登錄工作空間。
在數據科學與工程或數據鏈機器學習角色中,單擊計算。
點擊創建群集。
輸入集群的名稱。
為了Databricks運行時版本:
點擊ML。
選擇10.3毫升(Scala 2.12,Spark 3.2.1)或更高,或10.3毫升(GPU,Scala 2.12,Spark 3.2.1)或更高。
點擊高級選項。放安全模式至用戶隔離或者單用戶。要運行Python代碼,您必須使用單用戶。
用戶隔離簇可以由多個用戶共享,但僅支持SQL工作負載。也禁用了一些高級群集功能,例如庫安裝,init腳本和DBFS保險絲安裝座,以確保群集用戶之間的安全隔離。
要使用那些高級群集功能或語言,或使用Python,Scala和R運行工作負載,請將群集模式設置為單個用戶。單用戶群集還可以運行SQL工作負載。群集可以由單個用戶專門使用(默認情況下,群集的所有者);其他用戶不能將其附加到集群上。自動化作業應在此模式下運行,作業的所有者應該是集群的所有者。在此模式下,視圖安全性無法執行。從視圖中選擇的用戶使用自己的權限執行。
有關每個安全模式中可用功能的更多信息,請參見集群安全模式。
點擊創建群集。
創建一個數據鏈球機SQL倉庫
需要Databricks SQL倉庫才能在Databricks SQL中運行工作負載,例如查詢,儀表板和可視化。
為了創建一個可以訪問Unity目錄數據的SQL倉庫:
作為工作區級管理員登錄工作空間。
從角色切換器中選擇SQL。
點擊創造,然後選擇SQL倉庫。
在下麵高級設置放渠道至預習。
(可選)將SQL倉庫配置為無服務器SQL倉庫(預覽)。
無服務器SQL倉庫在幾秒鍾內開始,而不是分鍾。有關更多信息,請參閱無服務器計算。
SQL倉庫是使用正確的安全模式自動創建的,無需配置。