我們不需要為δ設置分區表我們沒有許多性能問題和三角洲湖開箱即用的優化為我們偉大的工作。但是現在有一個需要設置一個特定的分區列一些表允許並發三角洲合並分區。
我們使用非托管表與數據坐在s3
最好的方法是什麼現有的三角洲表上添加/更新分區列?
我試過的改變表日誌添加分區(日期=日期“2021-09-10”),但它沒有工作也不添加分區所有值的日期
也試著改寫表和設置分區列:
(df.write.format(“δ”).mode .option(“覆蓋”)(“overwriteSchema”,“真正的”).partitionBy(<名稱>上校).saveAsTable(表名稱> <))
但我不認為分區名稱,當我檢查表描述表,所以不確定這是正確的方法。
另一個選擇是重新創建表和我一樣看到我們可以設置分區列在創建一個表,但是真的不想這樣做除了作為最後的手段。