集群基礎知識
為了運行數據分析工作流磚筆記本,你必須把你的筆記本一個集群。通常,磚管理員創建的集群。但是,如果你被要求這樣做,下麵的視頻提供了一個有用的集群的概述:它們是什麼,以及如何為你的工作選擇正確的類型。
什麼是集群?
磚集群是一組計算資源執行的重任在磚工作負載運行的所有數據。這些工作負載可以在筆記本電腦運行的命令,命令從BI工具連接到磚,或自動的工作你安排。集群執行這些工作負載,然後返回結果的處理或保存到數據存儲。
集群由多個節點(個人機),操作並行工作負載。有一個司機節點為每個集群,這是代表任務並監督執行特定的工作負載。也有許多工人每個集群節點執行處理。如果一個工人在磚集群中節點丟失任何理由,司機可以重新分配剩餘的工作,剩下的節點。
集群需要注意的一件事是,有大量的自定義,可以在集群的各個層麵:自定義圖片,配置、初始化腳本和安全控製。