解決:火花司機-磚- 21405內存不足問題

chandan_a_v · ‎05-05-2022

你好,

在磚我執行一個簡單的工作,我得到以下錯誤。我增加了司機的大小仍然麵臨著同樣的問題。

火花配置:

從pyspark。sql進口SparkSession

spark_session = SparkSession.builder。瀏覽器名稱(“需求預測”). config (“spark.yarn.executor。memoryOverhead ", 2048) .getOrCreate ()

司機和工人-r5.2xlarge節點類型

10個工作節點。

錯誤日誌:

引起的:org.apache.spark.sql.execution。OutOfMemorySparkException:播放表的大小遠遠超過預期,超過極限spark.driver.maxResultSize = 4294967296。

chandan_a_v · ‎06-02-2022

嗨@Kaniz開羅,

切換運行時版本10.4固定這個問題對我來說。

謝謝,

的孩子叫

在原帖子查看解決方案

werners1 · ‎05-05-2022

查看錯誤消息你要廣播一個大桌子。刪除廣播聲明大桌子,你會沒事的。

chandan_a_v · ‎05-08-2022

嗨@Werner Stinckens,

我上麵的問題而編寫一個火花DF AWS S3的鑲花的文件。實際上不做任何廣播加入。

謝謝,

的孩子叫

Hubert_Dudek1 · ‎05-06-2022

在我看來在磚上,您不需要指定(spark_session = SparkSession.builder。瀏覽器名稱(“需求預測”). config (“spark.yarn.executor。memoryOverhead ", 2048) .getOrCreate ()) and rest is as @Werner Stinckens said

chandan_a_v · ‎05-08-2022

我上麵的問題而編寫一個火花DF AWS S3的鑲花的文件。實際上不做任何廣播加入。

磚

火花司機內存不足的問題