是的,這是什麼分區。
所有你需要的是一種常見的路徑,你將寫所有這些文件,和分區的一部分並不常見。
初版
/路徑/ / file1 | <數據>
/路徑/ / file2 | <數據>
公共部分(/路徑/),你使用目標位置。
變化的部分(file1 file2)您使用分區列
所以它將成為:
df.write.partitionBy (< fileCol >) .parquet (< commonPath >)
火花將編寫一個文件(甚至超過1)分區。
如果你希望隻有一個單一的文件你也必須由filecol重新分區。