2022年5月19日由ashish更新
目錄結構衝突錯誤
您有一個Apache Spark作業失敗,出現Java斷言錯誤Java .lang. assertionerror: assertion failed: detected到衝突的目錄結構。示例堆棧跟蹤由:org.apache.spark.sql.streaming.StreamingQueryException引起:當試圖推斷當前批文件的分區模式時,有一個錯誤。請求……
1分鍾閱讀時間
2022年5月19日由ashish更新
作業在啟動前保持空閑狀態
有一個Apache Spark作業正常觸發,但在啟動前長時間處於閑置狀態。您有一個Spark作業,它運行了一段時間,但在恢複之前很長一段時間都處於閑置狀態。症狀包括:集群在空閑時間縮小到工作節點的最小數目。司機日誌沒有顯示任何Spark作業在idl…
0分鍾閱讀時間
由ashish於2022年5月11日更新
流作業降低了性能
你有一個流作業,它的性能會隨著時間的推移而下降。使用相同的配置和相同的源啟動一個新的流作業,它的性能比現有作業更好。舊檢查點的問題會導致長時間運行的流作業性能下降。如果工作是間歇性的,就會發生這種情況。
0分鍾閱讀時間
2022年5月19日由ashish更新
使用Kinesis連接器的流作業失敗
你有一個流作業寫入到一個Kinesis接收器,它正在失敗與內存不足的錯誤消息。Java .lang. outofmemoryerror: Java堆空間。症狀包括:Ganglia顯示JVM內存使用量逐漸增加。微批分析顯示輸入和處理率是一致的…
0分鍾閱讀時間
由ashish於2022年5月11日更新
Apache Spark UI顯示錯誤的作業數量
現象描述在Spark界麵查看集群中活動的Apache Spark任務數,數量過高,不準確。如果重新啟動集群,Spark UI中顯示的作業數量一開始是正確的,但隨著時間的推移,它會異常地增長。原因Spark UI對於大型或長時間運行的集群並不總是準確的…
0分鍾閱讀時間
加載更多