集群基礎知識

為了運行數據分析工作流磚筆記本,你必須把你的筆記本一個集群。通常,磚管理員創建的集群。但是,如果你被要求這樣做,下麵的視頻提供了一個有用的集群的概述:它們是什麼,以及如何為你的工作選擇正確的類型。

什麼是集群?

磚集群是一組計算資源執行的重任在磚工作負載運行的所有數據。這些工作負載可以在筆記本電腦運行的命令,命令從BI工具連接到磚,或自動的工作你安排。集群執行這些工作負載,然後返回結果的處理或保存到數據存儲。

集群由多個節點(個人機),操作並行工作負載。有一個司機節點為每個集群,這是代表任務並監督執行特定的工作負載。也有許多工人每個集群節點執行處理。如果一個工人在磚集群中節點丟失任何理由,司機可以重新分配剩餘的工作,剩下的節點。

集群需要注意的一件事是,有大量的自定義,可以在集群的各個層麵:自定義圖片,配置、初始化腳本和安全控製。

集群配置

你配置集群的方式取決於您正在運行的工作負載。這個視頻回顧了標準配置選項:

關於集群配置的更多信息,包括先進的配置,明白了配置集群

集群的最佳實踐

當你開始創建集群時,你會發現有一個壓倒性的選項和功能可以供你選擇。這個視頻介紹配置集群的最佳實踐和突出時可能遇到的常見場景創建集群。

為更多的信息關於集群的最佳實踐,微調,和提高工作運行在磚上,見:

磚的價格

使用磚磚價格單位,或“DBUs”。在這個視頻中,我們將解釋集群使用如何影響多少磚單位使用,並在磚你花多少錢。