2022年5月19日由ashish更新

目錄結構衝突錯誤

您有一個Apache Spark作業失敗,出現Java斷言錯誤Java .lang. assertionerror: assertion failed: detected到衝突的目錄結構。示例堆棧跟蹤由:org.apache.spark.sql.streaming.StreamingQueryException引起:當試圖推斷當前批文件的分區模式時,有一個錯誤。請求……

1分鍾閱讀時間
2022年5月19日由ashish更新

作業在啟動前保持空閑狀態

有一個Apache Spark作業正常觸發,但在啟動前長時間處於閑置狀態。您有一個Spark作業,它運行了一段時間,但在恢複之前很長一段時間都處於閑置狀態。症狀包括:集群在空閑時間縮小到工作節點的最小數目。司機日誌沒有顯示任何Spark作業在idl…

0分鍾閱讀時間
由ashish於2022年5月11日更新

流作業降低了性能

你有一個流作業,它的性能會隨著時間的推移而下降。使用相同的配置和相同的源啟動一個新的流作業,它的性能比現有作業更好。舊檢查點的問題會導致長時間運行的流作業性能下降。如果工作是間歇性的,就會發生這種情況。

0分鍾閱讀時間
2022年5月19日由ashish更新

使用Kinesis連接器的流作業失敗

你有一個流作業寫入到一個Kinesis接收器,它正在失敗與內存不足的錯誤消息。Java .lang. outofmemoryerror: Java堆空間。症狀包括:Ganglia顯示JVM內存使用量逐漸增加。微批分析顯示輸入和處理率是一致的…

0分鍾閱讀時間
由ashish於2022年5月11日更新

Apache Spark UI顯示錯誤的作業數量

現象描述在Spark界麵查看集群中活動的Apache Spark任務數,數量過高,不準確。如果重新啟動集群,Spark UI中顯示的作業數量一開始是正確的,但隨著時間的推移,它會異常地增長。原因Spark UI對於大型或長時間運行的集群並不總是準確的…

0分鍾閱讀時間
加載更多