10-22-202203:38我
你好,
我想申請熊貓功能(並網發電,concat、追加等)在PySpark DataFrame這樣計算多節點集群上完成。
我不想把PySpark DataFrame成熊貓DataFrame以後,我認為,隻用於計算一個節點。
最好的方法是什麼你建議使用熊貓功能PySpark DataFrame而在多節點集群中所有進程?
10-23-2022下午02:00
最好的是使用熊貓的火花,它實際上是可互換的隻是不同的API引發數據幀
進口pyspark。熊貓作為ps psdf = ps.range(10)自衛隊= psdf.to_spark ()。過濾器(“id > 5”) sdf.show ()
10-23-202203:06點
謝謝你的回複。
我想申請熊貓函數PySpark DataFrame(像我如何使用熊貓DataFrames上本地筆記本電腦)。但是,我認為上麵的示例使用PySpark函數“過濾器”。
從未顯出
加入我們的快速增長的數據專業人員和專家的80 k +社區成員,準備發現,幫助和合作而做出有意義的聯係。
點擊在這裏注冊今天,加入!
參與令人興奮的技術討論,加入一個組與你的同事和滿足我們的成員。