approx_count_distinct聚合函數

適用於:檢查標記是的磚的SQL檢查標記是的磚運行時

返回不同值的估計數字expr在組織內。

的實現使用密集的版本HyperLogLog + + (HLL + +)算法,一個國家的藝術基數估計算法。

結果在5%的默認值是準確的,它來源於最大相對標準偏差的價值,盡管這是可配置的relativeSD參數如下提到的。

語法

approx_count_distinct(expr(,relativeSD])(過濾器(在哪裏氣孔導度)]

這個函數也可以作為一個調用窗口函數使用條款。

參數

  • expr:可以是任何類型的等價定義。

  • relativeSD:定義允許的最大相對標準偏差。

  • 氣孔導度:一個可選的布爾表達式過濾行用於聚合。

返回

長整型數字。

例子

>選擇approx_count_distinct(col1)(1),(1),(2),(2),(3)選項卡(col1);3>選擇approx_count_distinct(col1)過濾器(在哪裏col2=10)(1,10),(1,10),(2,10),(2,10),(3,10),(1,12)作為選項卡(col1,col2);3