任何在請建議我們如何有效地循環……頁3 -磚- 19402

Ancil · ‎12-01-2022

場景:我有一個dataframe超過1000行,每一行有一個文件路徑和結果數據列。我需要遍曆文件路徑和寫文件,每一行與列的數據結果。

時間和最簡單有效的方法是什麼呢?

我試著收集和采取長時間。

我試過下麵但UDF方法錯誤

NhatHoang · ‎12-01-2022

你好,

我同意維爾納,盡量避免循環與Pyspark Dataframe。

如果你dataframe很小,像你說的,隻有大約1000行,你可能會考慮使用熊貓。

謝謝。

Ancil · ‎12-01-2022

嗨@Nhat黃平君

大小可能不同可能多達十萬盧比,我將檢查和熊貓

磚