執行真空執行垃圾清理桌子上的目錄。默認情況下,保留7天的閾值將被執行。
請按照以下步驟執行真空:
1)。集spark.databricks.delta.retentionDurationCheck.enabled假;這個命令將覆蓋保留閾值檢查讓我們證明永久刪除的數據。
注意:吸塵用短保留生產表會導致數據損壞和/或失敗的長時間運行的查詢和極端的禁用此設置時應謹慎。
2)。永久刪除數據文件,評審之前手動使用幹運行選項:
所有數據文件的當前版本表中沒有將顯示在上麵的預覽。
真空豆類保持0小時排練
3)。再次運行該命令排練要永久刪除這些文件:
真空豆類保持0小時
注意:所有的以前版本的表將不再訪問。
因為真空可以如此重要的破壞性行為數據集,它總是一個好主意將保留時間檢查。運行下麵的細胞反應這個設置:spark.databricks.delta.retentionDurationCheck.enabled正確;
重要提示:因為δ緩存存儲的副本文件查詢當前會話中存儲卷部署到您的當前活動集群,您可能仍然能夠暫時訪問以前的表版本。
重新啟動集群將確保這些永久清除緩存數據文件。重新啟動集群後,再次查詢你的表,確認你沒有訪問以前的表版本。
執行真空執行垃圾清理桌子上的目錄。默認情況下,保留7天的閾值將被執行。
請按照以下步驟執行真空:
1)。集spark.databricks.delta.retentionDurationCheck.enabled假;這個命令將覆蓋保留閾值檢查讓我們證明永久刪除的數據。
注意:吸塵用短保留生產表會導致數據損壞和/或失敗的長時間運行的查詢和極端的禁用此設置時應謹慎。
2)。永久刪除數據文件,評審之前手動使用幹運行選項:
所有數據文件的當前版本表中沒有將顯示在上麵的預覽。
真空豆類保持0小時排練
3)。再次運行該命令排練要永久刪除這些文件:
真空豆類保持0小時
注意:所有的以前版本的表將不再訪問。
因為真空可以如此重要的破壞性行為數據集,它總是一個好主意將保留時間檢查。運行下麵的細胞反應這個設置:spark.databricks.delta.retentionDurationCheck.enabled正確;
重要提示:因為δ緩存存儲的副本文件查詢當前會話中存儲卷部署到您的當前活動集群,您可能仍然能夠暫時訪問以前的表版本。
重新啟動集群將確保這些永久清除緩存數據文件。重新啟動集群後,再次查詢你的表,確認你沒有訪問以前的表版本。