作業失敗,出現非典型錯誤消息

作業運行被限製,由於觀察到非典型錯誤消息而失敗。

寫的亞當Pavlacka

最後發布日期:2022年5月11日

問題

您的作業運行失敗由於觀察非典型誤差而節流錯誤消息。

Cluster was unreachable during run原因:xxx-xxxxxx-xxxxxxx is throttle, because observed非典型錯誤

導致

這個集群上的作業向Apache Spark驅動程序節點返回了太多的大結果。

結果,司機服務耗盡內存,集群變得不可訪問。

調用.collect,告訴API。

解決方案

的值可以減少集群上的工作負載或增加spark.memory.chauffeur.size

司機服務與Spark驅動運行在同一主機上。當為chauffeur服務分配更多內存時,用於Spark驅動程序的總內存將減少。

設置的值spark.memory.chauffeur.size

  1. 在工作空間中打開集群配置頁麵。
  2. 點擊編輯
  3. 擴大高級選項
  4. 輸入的值spark.memory.chauffeur.size以MB為單位火花配置字段。
  5. 點擊確認並重啟
刪除

信息

的默認值spark.memory.chauffeur.size是1024兆字節。這被寫成spark.memory.chauffeur.size 1024 mbSpark配置。最大值為16gb或驅動節點總內存的20%之間的較低者。