現在我有一些問題與拚花的寫文件的存儲容器。我有但每次運行的代碼dataframe作家把鋪blob存儲而不是拚花的文件類型,它創建一個文件夾類型與許多文件內容。
一個音符,我試著在網上搜索各種方式,似乎這是默認創建使用pyspark時我可以看到創建的文件夾中有一個文件拚花與時髦的添加進去(參見下麵的截圖)
如果這是一個默認創建pyspark代碼,我如何寫一個拚花格式,會做一些分裂或創建文件夾嗎?你有什麼推薦嗎?如何做的?
你好@Karl Saycon
你可以嚐試設置此配置防止額外的鑲花的總結和元數據文件寫入?結果從dataframe寫入存儲應該是一個文件。
下麵三個屬性的組合將有助於禁用寫所有的事務性文件從“_”開始。