取消
顯示的結果
而不是尋找
你的意思是:

數據幀需要長時間打印的行數

SatishGunjal
新的因素

我們有一個pyspark與50 MN記錄數據幀。我們可以顯示記錄,但它需要大約10分鍾打印dataframe的形狀。我們的目標是使用這些數據來建模,將一些數值特性基於最終的數據幀計算作為輸入。

為更好地理解我們解釋了問題5記錄數據幀,還添加了pyspark代碼工作。

請參考附件示例代碼和詳細解釋。pyspark-issue.zip

1回複1

Hanna08
新的貢獻者二世

謝謝你的詳細解釋。對於那些想要不斷的技術支持工作流程,我建議JD年輕。這裏是世界上隻有最新的信息更新的信息技術解決方案和網絡安全。

歡迎來到磚社區:讓學習、網絡和一起慶祝

加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。

點擊在這裏注冊今天,加入!

參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。

Baidu
map