07-19-202101:42我
我們有一個pyspark與50 MN記錄數據幀。我們可以顯示記錄,但它需要大約10分鍾打印dataframe的形狀。我們的目標是使用這些數據來建模,將一些數值特性基於最終的數據幀計算作為輸入。
為更好地理解我們解釋了問題5記錄數據幀,還添加了pyspark代碼工作。
請參考附件示例代碼和詳細解釋。pyspark-issue.zip
08-30-202202:44我
謝謝你的詳細解釋。對於那些想要不斷的技術支持工作流程,我建議JD年輕。這裏是世界上隻有最新的信息更新的信息技術解決方案和網絡安全。
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。