集群BY子句

適用於:檢查標記是的磚的SQL檢查標記是的磚運行時

重新分配數據基於輸入表達式,然後每個分區內的數據。這是執行一個語義上等價分發的緊隨其後的是一個排序。這一條款隻有確保每個分區內合成行排序,並不能保證全序輸出。

語法

集群通過表達式(,]

參數

  • 表達式

    指定一個或多個值的組合,運營商和SQL函數,結果在一個值。

例子

>創建臨時視圖(的名字,年齡)作為(“禪回族”,25),(“阿尼爾B”,18),(照年代”,16),(“邁克”,25),(“約翰一”,18),(“傑克N”,16);——調整分區的數量減少到2來說明的集群”的行為。——很容易看到聚類和排序行為更少數量的分區。>火花sql洗牌分區=2;——選擇行沒有訂購。請注意,沒有任何指示,結果——查詢的不確定性。這裏包括行為的差異——查詢當不使用的集群的vs的時候使用。下麵的查詢生成的行——年齡列排序。>選擇年齡,的名字;16年代25回族16傑克N25邁克一個18約翰一個18阿尼爾B——生產行集群的年齡。同年齡的人聚集在一起。在下麵的查詢,與18歲和25人在第一個分區和——16歲的人都在第二個分區。行排序——年齡在每個分區上。>選擇年齡,的名字集群通過年齡;18約翰一個18阿尼爾B25回族25邁克一個16年代16傑克N