取消
顯示的結果
而不是尋找
你的意思是:

錯誤的ConnectException

Raymond_Hu
新的因素

我用PySpark磚和試圖樞軸27753444 X 3矩陣。

如果我用火花DataFrame:

df = df.groupBy .pivot (A) (B) .avg (“C”)

需要永遠(2小時後,我取消了)。

如果我把它轉換成熊貓dataframe然後主:

pandas_df = pandas_df.pivot(指數= ' A ',列= B值= ' C ') .fillna (0)

它總是給我一個錯誤:

ConnectException:拒絕連接(連接拒絕)錯誤而獲得一個新的溝通渠道的ConnectException錯誤:這通常是由一個伯父錯誤導致到Python REPL的連接被關閉。檢查你的查詢的內存使用。

然而,我已經增加了我的群192 GB的記憶,它仍然不工作。

有人可以幫忙嗎?

謝謝!

1回複1

shyam_9
價值貢獻
價值貢獻

嗨@Raymond_Hu,

這意味著司機撞因為伯父(內存)的異常之後,不能夠與司機建立一個新的連接。請嚐試以下選項

  • 試著增加駕駛員一側的記憶,然後重試。
  • 你可以看看火花工作dag給你更多的信息在數據流。
歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map