我不確定。當你調用這個函數to_excel所有數據加載到司機(如果你正在做一個收集)。所以,寫作並不是分布式和你可以有內存和性能問題正如我所提到的。
試著用這個庫:
https://github.com/crealytics/spark-excel
示例(https://github.com/crealytics/spark-excel/issues/134 # issuecomment - 517696354):
df.write
.format (“com.crealytics.spark.excel”)
.save (“test.xlsx”)