你好,在rerence//www.eheci.com/blog/2022/11/18/introducing攝入-時間-聚類- dbr - 112. - html
我有一個愚蠢的問題如何使用它。假設我有一些結核病不分區的數據。所以,如果我想查詢數據攝取從昨天開始,我應該做些什麼呢?
選擇從mytable *WHAT_SHOULD_BE_HERE> = current_timestamp()——間隔1天
換句話說,我需要查詢,以確保隻有一小部分的“文件”將“翹望”而不是整個數據集。很明顯對我如何達到使用分區,但攝入時間聚類?
嗨@mderela,你可以添加pipelines-Auto-optimize-zOrderCols參數優化數據跳過與z順序索引。z值是一個技術把相關信息在同一組文件,由data-skipping自動使用算法來減少需要讀取的數據量。z值數據,指定列的順序在order BY子句。
例如,要把性別,運行:
sql優化people_10m ZORDER(性別)
。為ZORDER可以指定多個列作為一個逗號分隔的列表,但是當地的有效性下降與每一個額外的列。z值列上,沒有統計數據是無效和浪費資源。數據不需要column-local統計如敏,馬克斯和計數。您可以配置重新排序的列統計信息收集特定列的模式或增加列的數量收集統計信息。
嗨@mderela,你可以添加pipelines-Auto-optimize-zOrderCols參數優化數據跳過與z順序索引。z值是一個技術把相關信息在同一組文件,由data-skipping自動使用算法來減少需要讀取的數據量。z值數據,指定列的順序在order BY子句。
例如,要把性別,運行:
sql優化people_10m ZORDER(性別)
。為ZORDER可以指定多個列作為一個逗號分隔的列表,但是當地的有效性下降與每一個額外的列。z值列上,沒有統計數據是無效和浪費資源。數據不需要column-local統計如敏,馬克斯和計數。您可以配置重新排序的列統計信息收集特定列的模式或增加列的數量收集統計信息。