pyspark.sql.functions.grouping_id

pyspark.sql.functions。 grouping_id ( *關口:ColumnOrName )→pyspark.sql.column.Column

聚合函數:返回的水平分組,等於

(分組(c1) < < (n - 1)) +(分組(c2) < < (n - 2) +…+分組(cn)

筆記

列的列表應該匹配分組列,或空(意味著所有分組列)。

例子

> > >df多維數據集(“名稱”)gg(grouping_id(),總和(“年齡”))orderBy(“名稱”)顯示()+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - + +| | |名稱grouping_id()和()歲|+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - + +零| 1 | | |愛麗絲| | 0 | 2 |鮑勃| 0 | | 5 |+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - + +