看來生活和曆史集群指標

這篇文章解釋了如何使用磚UI的本地集群度量工具收集關鍵硬件和火花指標。使用磚的集群運行時13.0及以上默認訪問這些指標。

以前,集群指標聚集使用Ganglia,提供有限的集群的外部生活飼料指標。Ganglia隻能記錄曆史數據在15塊,存檔使用靜態可下載的快照。

現在,所有生活和曆史集群指標嵌入到磚UI。這些度量一個可以過濾任何範圍的日期、小時、分鍾過去30天內。

訪問集群指標UI

查看集群指標界麵:

  1. 點擊計算在側邊欄。

  2. 點擊你想查看指標的計算資源。

  3. 單擊指標選項卡。

集群指標在過去的24小時

默認顯示硬件指標。查看火花指標,點擊下拉標簽硬件並選擇火花。您也可以選擇GPU如果GPU-enabled實例。

通過時間段過濾指標

您可以查看曆史指標通過選擇時間範圍使用日期選擇過濾器。收集度量每一分鍾,所以你可以過濾任何範圍的天,小時或分鍾從過去的30天。單擊日曆圖標選擇從預定義的數據範圍,或單擊文本框內定義自定義值。

請注意

圖表中顯示的時間間隔調整根據您正在查看的時間長度。大多數平均指標是基於你當前瀏覽的時間間隔。

您還可以通過單擊獲得最新的指標刷新按鈕。

在節點級別指標

您可以查看度量單個節點通過單擊集群下拉菜單並選擇您想要查看的節點指標。

請注意

GPU指標隻在節點級別。火花指標不能用於單個節點。

CPU指標圖表

下麵的集群中的可用CPU指標圖表查看指標界麵:

  • CPU利用率:CPU時間的比例在每個模式,基於CPU秒總成本。基於哪個指標是平均時間間隔顯示在圖表中。

  • 內存利用率:總內存使用量由每個模式,以基於哪個字節數和平均時間間隔顯示在圖表中。

  • 內存交換的使用率:總內存交換使用由每個模式,以基於哪個字節數和平均時間間隔顯示在圖表中。

  • 免費的文件係統空間:總文件係統使用每個掛載點,以基於哪個字節數和平均時間間隔顯示在圖表中。

  • 通過網絡接收:接收的字節數每個設備,通過網絡的平均出基於任何時間間隔顯示在圖表中。

  • 通過網絡傳播:通過網絡傳輸的字節數,每個設備平均出基於任何時間間隔顯示在圖表中。

  • 活躍節點:這表明活動節點的數量在每一個時間戳為給定的集群。

火花指標圖表

可用以下火花指標圖表查看集群中的指標界麵:

  • 活動任務:任務執行的總數在任何給定的時間,平均出基於任何時間間隔顯示在圖表中。

  • 總失敗的任務:任務未能執行人的總數,平均出基於任何時間間隔顯示在圖表中。

  • 總完成任務:完成的任務執行人總數,平均出基於任何時間間隔顯示在圖表中。

  • 總數量的任務:所有任務的總數(跑步、失敗和完成)的執行人,平均出基於任何時間間隔顯示在圖表中。

  • 總洗牌讀:隨機讀取數據的總大小,以字節和平均基於任何時間間隔顯示在圖表中。洗牌意味著序列化的讀取數據的總和所有執行者的開始階段。

  • 總洗牌寫:洗牌寫數據的總大小,單位為字節數和平均基於任何時間間隔顯示在圖表中。洗牌是所有書麵序列化數據的總和執行人之前傳輸(通常在結束階段)。

  • 總任務持續時間:總運行時間執行任務執行人JVM花,以基於哪個秒,平均時間間隔顯示在圖表中。

GPU指標圖表

下麵的GPU集群中的度量圖可用來查看指標界麵:

  • Per-GPU解碼器利用率:GPU譯碼器的利用率,平均出基於任何時間間隔顯示在圖表中。

  • :Per-GPU編碼器利用GPU編碼器的利用率,平均基於任何時間間隔顯示在圖表中。

  • Per-GPU幀緩衝內存利用率字節:幀緩衝內存利用率,以基於哪個字節數和平均時間間隔顯示在圖表中。

  • Per-GPU內存利用率:GPU內存利用率的比例,平均出基於任何時間間隔顯示在圖表中。

  • Per-GPU利用率:基於GPU的利用率,平均出哪個時間間隔顯示在圖表中。