pyspark.sql.DataFrame.cube

DataFrame。 多維數據集 ( *關口:ColumnOrName )→GroupedData

為當前創建多維數據集DataFrame使用指定的列,所以我們可以運行聚合。

例子

> > >df多維數據集(“名稱”,df年齡)()orderBy(“名稱”,“年齡”)顯示()+ - - - + - - - + - - - - - - +| | |名字年齡|計數+ - - - + - - - + - - - - - - +零零| | | 2 |零| | 2 | 1 |零| | 5 | 1 |零| 1 | | |愛麗絲愛麗絲| | 2 | 1 ||鮑勃零| 1 | |鮑勃| | 5 | 1 |+ - - - + - - - + - - - - - - +