pyspark.sql.functions.grouping_id¶

pyspark.sql.functions。 grouping_id ( *關口:ColumnOrName )→pyspark.sql.column.Column¶

聚合函數:返回的水平分組,等於

(分組(c1) < < (n - 1)) +(分組(c2) < < (n - 2) +…+分組(cn)

筆記

列的列表應該匹配分組列,或空(意味著所有分組列)。

例子

           > > >df。多維數據集(“名稱”)。gg(grouping_id(),總和(“年齡”))。orderBy(“名稱”)。顯示()+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - + +| | |名稱grouping_id()和()歲|+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - + +零| 1 | | |愛麗絲| | 0 | 2 |鮑勃| 0 | | 5 |+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - + +
          

以前的

pyspark.sql.functions.grouping

下一個

pyspark.sql.functions.kurtosis