創建計算資源

預習

Unity目錄在公共預覽。要參與預覽,請聯係您的數據助理代表。

本文展示了如何創建數據科學與工程或數據鏈機器學習群集或Databricks SQL倉庫,該倉庫可以訪問Unity目錄中的數據。

要求

  • 您的Databricks帳戶必須在高級計劃

  • 在工作區中,您必須有權創建計算資源。

創建數據科學與工程集群

數據科學與工程集群設計用於運行一般工作負載,例如筆記本電腦。

創建一個可以訪問Unity目錄的數據科學與工程集群:

  1. 作為工作區級管理員登錄工作空間。

  2. 點擊計算圖標計算

  3. 點擊創建群集

    1. 輸入集群的名稱。

    2. Databricks運行時版本運行時:10.3(Scala 2.12,Spark 3.2.1)或更高。

  4. 點擊高級選項。放安全模式用戶隔離或者單用戶

    用戶隔離簇可以由多個用戶共享,但僅支持SQL工作負載。也禁用了一些高級群集功能,例如庫安裝,init腳本和DBFS保險絲安裝座,以確保群集用戶之間的安全隔離。

    要使用那些高級群集功能或語言,或使用Python,Scala和R運行工作負載,請將群集模式設置為單個用戶。單用戶群集還可以運行SQL工作負載。群集可以由單個用戶專門使用(默認情況下,群集的所有者);其他用戶不能將其附加到集群上。自動化作業應在此模式下運行,作業的所有者應該是集群的所有者。在此模式下,視圖安全性無法執行。從視圖中選擇的用戶使用自己的權限執行。

    有關每個安全模式中可用功能的更多信息,請參見集群安全模式

  5. 點擊創建群集

創建數據鏈機器學習群集

Databricks機器學習群集是針對機器學習工作負載的專門構建的。您可以選擇創建一個啟用了GPU的數據鏈機器學習群集。

為了創建一個可以訪問Unity目錄的Databricks機器學習群集:

  1. 作為工作區級管理員登錄工作空間。

  2. 在數據科學與工程或數據鏈機器學習角色中,單擊計算圖標計算

  3. 點擊創建群集

    1. 輸入集群的名稱。

    2. 為了Databricks運行時版本

      1. 點擊ML

      2. 選擇10.3毫升(Scala 2.12,Spark 3.2.1)或更高,或10.3毫升(GPU,Scala 2.12,Spark 3.2.1)或更高。

  4. 點擊高級選項。放安全模式用戶隔離或者單用戶。要運行Python代碼,您必須使用單用戶

    用戶隔離簇可以由多個用戶共享,但僅支持SQL工作負載。也禁用了一些高級群集功能,例如庫安裝,init腳本和DBFS保險絲安裝座,以確保群集用戶之間的安全隔離。

    要使用那些高級群集功能或語言,或使用Python,Scala和R運行工作負載,請將群集模式設置為單個用戶。單用戶群集還可以運行SQL工作負載。群集可以由單個用戶專門使用(默認情況下,群集的所有者);其他用戶不能將其附加到集群上。自動化作業應在此模式下運行,作業的所有者應該是集群的所有者。在此模式下,視圖安全性無法執行。從視圖中選擇的用戶使用自己的權限執行。

    有關每個安全模式中可用功能的更多信息,請參見集群安全模式

  5. 點擊創建群集

創建一個數據鏈球機SQL倉庫

需要Databricks SQL倉庫才能在Databricks SQL中運行工作負載,例如查詢,儀表板和可視化。

為了創建一個可以訪問Unity目錄數據的SQL倉庫:

  1. 作為工作區級管理員登錄工作空間。

  2. 從角色切換器中選擇SQL

  3. 點擊創造,然後選擇SQL倉庫

  4. 在下麵高級設置渠道預習

  1. (可選)將SQL倉庫配置為無服務器SQL倉庫(預覽)。

    無服務器SQL倉庫在幾秒鍾內開始,而不是分鍾。有關更多信息,請參閱無服務器計算

SQL倉庫是使用正確的安全模式自動創建的,無需配置。