approx_top_k聚合函數

適用於:檢查標記是的磚的SQL檢查標記是的磚運行時10.2及以上

返回頂部k最常發生在一個項值expr以及它們的近似計算。

語法

approx_top_k(expr(,k(,maxItemsTracked]])(過濾器(在哪裏氣孔導度)]

參數

  • expr:一個表達式的字符串、布爾值、日期、時間戳、或數字類型。

  • k:一個可選的整型文字大於0。如果k沒有指定,默認嗎5

  • maxItemsTracked:一個可選的整型文字大於或等於k。如果maxItemsTracked沒有指定,默認嗎10000年

  • 氣孔導度:一個可選的布爾表達式過濾行用於聚合。

返回

結果返回一個結構體類型的數組,其中每個結構體包含一個字段的值(與原來的輸入類型)和一個類型的字段(長)的近似數出現。數組進行排序下行。

聚合函數返回頂部k最頻繁發生的項目值表達式中expr以及它們的近似計算。每個數可能的錯誤2.0*numRows/maxItemsTracked在哪裏numRows總行數。更高的值maxItemsTracked提供更好的準確性在內存使用增加的成本。不到的表達式maxItemsTracked不同的項目將產生精確的項數。結果包括值作為自己的項目結果。

例子

>選擇approx_top_k (expr)值(0)(0)(1)(1),(2),(3),(4),(4)選項卡(expr);[{“項”:4,“數”:2},{“項”:1、“數”:2},{“項”:0,“數”:2},{“項”:3,“數”:1},{“項”:2,“數”:1}]>選擇approx_top_k (expr 2)值' a ', ' b ', ' c ', ' c ', ' c ', ' c ', ' d ', ' d '選項卡(expr);[{“項”:“c”,“數”,4},{“項”:“d”,“數”:2}]>選擇approx_top_k (expr, 100)從值(0)(1)(1),(2),(2),(2)選項卡(expr);[{“項”:2,“數”:3},{“項”:1、“數”:2},{“項”:0,“數”:1}]