取消
顯示的結果
而不是尋找
你的意思是:

我需要運行.cache()在我dataframe返回之前聚合數嗎?

User16826992666
價值貢獻
2回答2

Srikanth_Gupta_
價值貢獻

最好使用緩存使用dataframe時多次在一個管道。

使用緩存(),堅持()方法,提供了一個火花優化機製來存儲中間計算火花DataFrame所以他們在後續操作中可以重用。

sean_owen
尊敬的貢獻者二世
尊敬的貢獻者二世

你不需要緩存任何工作。你將決定,根據你是否想花內存/存儲,以避免驗算DataFrame,比如你可以用它在多個操作。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map