創建一個集群

請注意

這些指令是更新UI創建集群。切換到傳統集群創建UI,點擊用戶界麵預覽在頁麵的頂部創建集群和切換設置。對於遺留UI文檔,看看配置集群。比較新和遺留的集群類型,明白了集群UI變化和集群訪問模式

本文解釋了可用的配置選項,當你創建和編輯數據磚集群。它著重於創建和編輯集群使用UI。其他方法,請參閱集群CLI,集群API 2.0,磚起程拓殖的提供者

集群創建用戶界麵允許您選擇集群配置細節,包括:

訪問集群創建接口

創建一個集群使用的用戶界麵,單擊創建集群按鈕或者點擊計算部分>集群在你的工作空間的導航。

集群配置界麵

請注意

您還可以使用磚起程拓殖提供者創建一個集群

集群政策

集群政策是一組規則用於限製用戶可用的配置選項時創建一個集群。集群政策acl控製特定的用戶和組可以訪問某些政策。

默認情況下,所有用戶都可以訪問個人計算* * * *政策,讓他們輕鬆地創建單機計算資源。如果你看不到個人計算政策作為一個選項創建一個集群時,那麼你還沒有得到政策。請聯係您的係統管理員請求訪問個人計算政策或一個適當的政策。

顯示配置集群政策,選擇一個集群的政策政策下拉。

集群訪問模式是什麼?

訪問模式下拉已經取代了安全模式下拉。訪問模式標準如下:

訪問模式下拉

對用戶可見

統一目錄支持

支持的語言

單用戶

總是

是的

Python, SQL, Scala, R

共享

總是(保費計劃要求)

是的

Python、SQL

任何隔離共享

管理員可以隱藏這個集群類型執行用戶隔離在管理控製台中。還看到一個相關帳戶級別設置為任何隔離共享集群

沒有

Python, SQL, Scala, R

自定義

此選項隻會顯示為現有的集群沒有訪問模式。如果創建一個集群與傳統集群模式,例如標準或高並發、磚顯示了該值的訪問模式,當你使用新的UI。這個值不是一個選項用於創建新集群。

沒有

Python, SQL, Scala, R

重要的

訪問模式集群API不支持。

磚的運行時版本的

磚運行時核心組件的集合,在您的集群上運行。所有磚運行時包含Apache火花和添加組件和更新,提高可用性,性能和安全。有關詳細信息,請參見磚運行時

磚提供了幾種類型的運行時和幾個版本的運行時類型。您選擇了集群的運行時使用磚的運行時版本的下拉當您創建或編輯一個集群。

集群節點類型

一個集群由一個驅動節點和零個或多個工作節點。你可以選擇單獨的雲提供商為司機和工人節點實例類型,盡管默認情況下司機節點使用相同的實例類型工作節點。不同家庭的實例類型適合不同的用例,如內存密集型或計算密集型工作負載。

司機節點

司機節點維護狀態信息的筆記本電腦連接到集群。司機節點還維護SparkContext,解釋所有的命令你在集群上運行從一個筆記本和一個圖書館,並運行Apache主坐標的火花引發執行人。

司機節點類型的默認值是一樣的工人節點類型。你可以選擇一個更大的驅動節點類型和更多的內存,如果你正計劃收集()大量的數據從引發工人和分析他們在筆記本上。

提示

因為司機節點維護的所有狀態信息的筆記本電腦,確保分離未使用的筆記本從司機節點。

工作者節點

磚工節點運行正常運轉所需的火花執行者和其他服務集群。當你分發工作負載與火花,所有的分布式處理發生在工作節點。磚一個人均執行器節點運行。因此,執行者和工人是交替使用的磚結構。

提示

火花運行工作,你至少需要一個工作節點。如果集群的工人為零,你可以運行non-Spark命令司機節點上,但火花命令將失敗。

工作者節點IP地址

磚發射的工人每個節點有兩個私有IP地址。節點的主要私人IP地址的主機磚內部交通。二次使用的私有IP地址是火花容器實現網內集群通信。這個模型允許磚提供多個集群之間的隔離在同一個工作區。

GPU實例類型

對於需求的高性能的計算有挑戰性的任務,像那些與深度學習,磚支持集群加速的圖形處理單元(gpu)。有關更多信息,請參見GPU-enabled集群

AWS引力子實例類型

預覽

這個特性是在公共預覽

磚支持集群AWS引力子處理器。基於arm的AWS引力子實例設計的AWS提供更好的價格性能比較當代基於x86的實例。看到AWS Graviton-enabled集群

集群規模和自動定量

當你創建一個磚集群,可以為集群提供一個固定數量的工人或提供的最小和最大數量的工人集群。

當你提供固定大小的集群,磚確保集群有指定數量的工人。當你為工人的數量,提供一係列磚選擇適當數量的工人需要運行你的工作。這被稱為自動定量

與自動定量、動態磚是重新分配人員占你的工作的特點。某些部位的管道可能比其他人更計算要求,和磚自動添加額外的工人在這階段的工作(並刪除他們當他們不再需要)。

自動定量使它更容易實現集群利用率高,因為你不需要提供集群匹配工作負載。這尤其適用於負載的需求隨時間變化(如每天探索過程中數據集),但它也能適用於一次性短工作負載的配置需求是未知的。自動定量因此提供了兩個優點:

  • 工作負載可以運行得更快而constant-sized under-provisioned集群。

  • 自動定量集群靜態大小的集群相比可以降低整體成本。

根據集群的常數大小和工作負載,自動定量給你其中的一個或兩個同時受益。集群規模可以低於最小數量的工人時選擇的雲提供商終止實例。在這種情況下,磚不斷重試重新供應實例為了維持最低的工人數量。

請注意

自動定量是不可用的spark-submit就業機會。

如何自動定量的行為

  • 尺度從最小到最大2步驟。

  • 集群可以縮小,即使不是閑置,通過觀察洗牌文件狀態。

  • 基於當前節點的比例尺度。

  • 工作群,尺度下如果集群充分利用過去40秒。

  • 通用的集群,尺度下如果集群充分利用過去150秒。

  • spark.databricks.aggressiveWindowDownS火花在幾秒鍾內配置屬性指定集群頻率使縮小規模的決定。持續增加的值會導致一個集群規模更慢。最大值是600。

啟用和配置自動定量

允許磚自動調整您的集群,啟用自動定量的集群和提供的最小和最大範圍的工人。

  1. 啟用自動定量。

    • 通用的集群,在集群上創建和編輯頁麵,選擇啟用自動定量複選框的自動駕駛儀的選擇箱:

      Enable_autoscaling交互式集群
    • 集群工作——在集群上創建和編輯頁麵,選擇啟用自動定量複選框的自動駕駛儀的選擇箱:

      啟用自動定量工作集群
  2. 配置min和max工人。

    配置min和max工人

    當集群運行時,集群的詳細頁麵顯示分配工人的數量。可以比較的數量分配工人與工人配置並根據需要做出調整。

重要的

如果您正在使用一個實例池:

  • 確定集群的大小要求是小於或等於最小數量的空閑實例在遊泳池裏。如果是較大的,集群啟動時間將相當於一個集群,不使用池。

  • 確保最大的集群大小小於或等於最大容量的池。如果是較大的,集群創建將會失敗。

自動定量的例子

如果你重新配置靜態集群是一個自動定量集群,磚立即調整集群的大小在最小和最大範圍內,然後開始自動定量。作為一個例子,下表顯示具有一定的初始大小的集群會怎樣如果你重新配置集群自動定量之間的5和10個節點。

初始大小

重新配置後尺寸

6

6

12

10

3

5

自動定量本地存儲

如果你不想分配一個固定數量的EBS卷在創建集群時,使用自動定量本地存儲。自動定量本地存儲,數據磚監視器上可用的空閑磁盤空間集群的火花的工人。如果一個工人開始在磁盤上運行過低,磚自動高度新EBS卷的工人之前耗盡磁盤空間。EBS卷附加到一個極限5 TB的總磁盤空間的每個實例(包括實例的本地存儲)。

配置自動定量儲存、選擇啟用自動定量本地存儲

啟用自動定量本地存儲

EBS卷附加到一個實例隻分離時返回給AWS實例。EBS卷,永遠不會脫離隻要是一個實例運行集群的一部分。縮減EBS用法,磚建議使用這個特性在集群配置AWS引力子實例類型自動終止

請注意

磚使用吞吐量的優化硬盤(死神)來擴展一個實例的本地存儲。的默認AWS容量限製這些數量是20 TiB。為了避免觸及這個極限,管理員應該請求增加這個極限根據自己的使用需求。

本地磁盤加密

預覽

這個特性是在公共預覽

一些實例類型用於在本地運行集群可能附加的磁盤。磚可能洗牌數據或臨時數據存儲在這些本地連接的磁盤。確保所有的數據是加密的存儲類型,包括改組數據暫時存儲在集群的本地磁盤,您可以啟用本地磁盤加密。

重要的

你的工作負載可能會更慢,因為閱讀和寫作加密數據對性能的影響,從本地卷。

當啟用本地磁盤加密時,磚在本地生成一個加密密鑰是獨一無二的每個集群節點,並用於加密所有數據存儲在本地磁盤。關鍵是當地的範圍到每個集群節點集群節點本身和被摧毀。在其一生中,加密和解密的關鍵駐留在內存中,加密存儲在磁盤上。

啟用本地磁盤加密,你必須使用集群API 2.0。在集群創建或編輯設置:

{“enable_local_disk_encryption”:真正的}

看到創建編輯在集群API參考如何調用這些API的例子。

下麵是一個示例集群的創建,使本地磁盤加密:

{“cluster_name”:“my-cluster”,“spark_version”:“7.3.x-scala2.12”,“node_type_id”:“r3.xlarge”,“enable_local_disk_encryption”:真正的,“spark_conf”:{“spark.speculation”:真正的},“num_workers”:25}