pyspark.sql.DataFrame.cube¶
-
DataFrame。
多維數據集
( *關口:ColumnOrName )→GroupedData¶ -
為當前創建多維數據集
DataFrame
使用指定的列,所以我們可以運行聚合。例子
> > >df。多維數據集(“名稱”,df。年齡)。數()。orderBy(“名稱”,“年齡”)。顯示()+ - - - + - - - + - - - - - - +| | |名字年齡|計數+ - - - + - - - + - - - - - - +零零| | | 2 |零| | 2 | 1 |零| | 5 | 1 |零| 1 | | |愛麗絲愛麗絲| | 2 | 1 ||鮑勃零| 1 | |鮑勃| | 5 | 1 |+ - - - + - - - + - - - - - - +