寫統計在一個檢查站成本通常是可見的隻有在非常大的表。然而值得一提的是,這種統計將是非常有用的數據不加快後續操作。
在磚7.2運行時,下麵列級統計數據存儲在三角洲湖檢查點,JSON列。在磚運行時7.3 LTS以上,列級統計信息存儲為結構(結構格式使三角洲湖讀快得多)
有兩個旗幟在檢查站控製列級統計
delta.checkpoint。writeStatsAsJson & delta.checkpoint。writeStatsAsStruct如果表屬性都是假的,沒有統計數據收集或寫,讀者無法執行數據跳過。
為更多的細節在權衡統計和檢查點,明白了在這裏