approx_top_k
聚合函數
適用於:磚的SQL磚運行時10.2及以上
返回頂部k
最常發生在一個項值expr
以及它們的近似計算。
參數
expr
:一個表達式的字符串、布爾值、日期、時間戳、或數字類型。k
:一個可選的整型文字大於0。如果k
沒有指定,默認嗎5
。maxItemsTracked
:一個可選的整型文字大於或等於k
。如果maxItemsTracked
沒有指定,默認嗎10000年
。氣孔導度
:一個可選的布爾表達式過濾行用於聚合。
返回
結果返回一個結構體類型的數組,其中每個結構體包含一個項
字段的值(與原來的輸入類型)和一個數
類型的字段(長)的近似數出現。數組進行排序數
下行。
聚合函數返回頂部k
最頻繁發生的項目值表達式中expr
以及它們的近似計算。每個數可能的錯誤2.0*numRows/maxItemsTracked
在哪裏numRows
總行數。更高的值maxItemsTracked
提供更好的準確性在內存使用增加的成本。不到的表達式maxItemsTracked
不同的項目將產生精確的項數。結果包括零
值作為自己的項目結果。
例子
>選擇approx_top_k (expr)值(0)(0)(1)(1),(2),(3),(4),(4)選項卡(expr);[{“項”:4,“數”:2},{“項”:1、“數”:2},{“項”:0,“數”:2},{“項”:3,“數”:1},{“項”:2,“數”:1}]>選擇approx_top_k (expr 2)值' a ', ' b ', ' c ', ' c ', ' c ', ' c ', ' d ', ' d '選項卡(expr);[{“項”:“c”,“數”,4},{“項”:“d”,“數”:2}]>選擇approx_top_k (expr, 100)從值(0)(1)(1),(2),(2),(2)選項卡(expr);[{“項”:2,“數”:3},{“項”:1、“數”:2},{“項”:0,“數”:1}]