pyspark.sql.functions.grouping_id¶
-
pyspark.sql.functions。
grouping_id
( *關口:ColumnOrName )→pyspark.sql.column.Column¶ -
聚合函數:返回的水平分組,等於
(分組(c1) < < (n - 1)) +(分組(c2) < < (n - 2) +…+分組(cn)
筆記
列的列表應該匹配分組列,或空(意味著所有分組列)。
例子
> > >df。多維數據集(“名稱”)。gg(grouping_id(),總和(“年齡”))。orderBy(“名稱”)。顯示()+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - + +| | |名稱grouping_id()和()歲|+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - + +零| 1 | | |愛麗絲| | 0 | 2 |鮑勃| 0 | | 5 |+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - + +