區分活躍和死的工作

學習如何區分活躍和死磚工作。

寫的亞當Pavlacka

去年發表在:2022年5月10日

問題

在集群上有太多並發工作,你經常看到一些工作停留在火花UI沒有任何進展。這複雜識別活動工作/階段與死者的工作階段。

導致

每當有太多並發工作一個集群上運行,有可能引發內部eventListenerBus下降的事件。這些事件是用來跟蹤工作進展引發的UI。每當事件監聽器下降事件你開始看到死工作/階段火花UI,從未完成。的工作實際上是完成但不顯示為完成火花UI。

你看到以下跟蹤在司機日誌:

18/01/25 06:37:32警告LiveListenerBus:自1月25日星期四下跌5044 SparkListenerEvents 06:36:32 UTC時間2018

解決方案

沒有辦法從火花UI中刪除死工作而不需要重新啟動集群。不過,您可以識別積極工作和階段通過運行以下命令:

% scala sc.statusTracker.getActiveJobIds() / /返回一個數組,其中包含id的所有活動的工作。sc.statusTracker.getActiveStageIds() / /返回一個數組,其中包含所有活動階段的id。