刪除向量是什麼?

預覽

支持閱讀和寫作δ表刪除向量公共預覽在磚運行時12.1及以上。

刪除向量是一個存儲優化功能,可以啟用三角洲湖表。默認情況下,當一行數據文件被刪除,整個鑲花包含記錄的文件必須重寫。啟用了刪除向量的表,刪除操作使用刪除向量將現有行標記為刪除沒有重寫鋪文件。後來讀桌子上解決當前表狀態通過應用刪除刪除向量最近的表所指出的版本。

請注意

光子利用刪除向量預測I / O更新,加速刪除,合並,更新操作。所有客戶支持閱讀刪除向量可以讀取更新產生刪除向量,無論這些更新預測產生的I / O。看到使用預測I / O加速更新

啟用刪除向量

啟用支持刪除向量在三角洲湖表通過設置一個三角洲湖表屬性:

改變<table_name>TBLPROPERTIES(“delta.enableDeletionVectors”=真正的);

警告

當您啟用刪除向量,表協議版本升級。表協議版本升級是不可逆的。升級後,表不會讀的三角洲湖客戶不支持刪除向量。看到磚三角洲湖管理功能的兼容性如何?

應用更改拚花的數據文件

軟刪除,刪除向量表示改變行邏輯修改現有的拚花三角洲湖表中的數據文件。這些變化應用物理數據文件重寫時,由下列事件之一:

  • 一個優化運行命令放在桌子上。

  • Auto-compaction觸發數據文件的修改與刪除向量。

  • REORG應用(清洗)對表運行。

事件相關的文件壓縮沒有嚴格的擔保解決變化記錄在刪除向量,和一些變化記錄在刪除向量可能不是應用如果目標數據文件不會否則候選文件壓縮。REORG應用(清洗)重寫所有數據文件包含記錄和修改記錄使用刪除向量。看到REORG表

請注意

在舊文件修改數據可能仍然存在。您可以運行真空物理刪除舊的文件。REORG應用(清洗)創建一個新版本的表在它完成的時候,這是你必須考慮的時間戳的保留閾值真空操作完全刪除刪除文件。看到刪除未使用的數據文件與真空

限製

在磚運行時的12.1和更高版本,存在以下局限性:

  • 三角洲與刪除共享表上的不支持向量啟用。

  • 你不能生成一個清單文件為一個表刪除向量。運行REORG應用(清洗)並確保沒有並發寫操作在運行,以生成一個清單。

  • 你不能逐步生成清單文件表啟用了刪除向量。