pyspark.pandas.DataFrame.aggregate

DataFrame。 ( 函數:聯盟[列表(str), Dict[聯盟[任何元組[,…]],[力量]]列表) )→pyspark.pandas.frame.DataFrame

總軸指定使用一個或多個操作。

參數
函數 dict或列表

dict類型映射的列名稱(字符串)聚合函數(字符串)的列表。如果一個列表,對所有列進行聚合。

返回
DataFrame

另請參閱

DataFrame.apply

DataFrame上調用函數。

DataFrame.transform

隻有執行類型轉換操作。

DataFrame.groupby

在執行操作組。

Series.aggregate

相當於函數級數。

筆記

gg是一個別名。使用別名。

例子

> > >df=psDataFrame([[1,2,3),(4,5,6),(7,8,9),(np,np,np]],=(“一個”,“B”,“C”])
> > >dfA B C0 1.0 2.0 3.01 4.0 5.0 6.02 7.0 8.0 9.03南南南

行聚合這些函數。

> > >dfgg([“和”,“最小值”))((“一個”,“B”,“C”]]sort_index()A B C分鍾1.0 2.0 3.0和12.0 15.0 18.0

每列不同的聚合。

> > >dfgg({“一個”:(“和”,“最小值”),“B”:(“最小值”,“馬克斯”]})[[“一個”,“B”]]sort_index()一個B馬克斯南8.0分鍾1.0 - 2.0和12.0南

多索引的列:

> > >df=pdMultiIndexfrom_tuples(((“X”,“一個”),(“X”,“B”),(“Y”,“C”)))> > >dfgg([“和”,“最小值”[[(])“X”,“一個”),(“X”,“B”),(“Y”,“C”)]]sort_index()X YA B C分鍾1.0 2.0 3.0和12.0 15.0 18.0
> > >聚合=dfgg({(“X”,“一個”):(“和”,“最小值”),(“X”,“B”):(“最小值”,“馬克斯”]})> > >聚合[[(“X”,“一個”),(“X”,“B”)]]sort_index()X一個B馬克斯南8.0分鍾1.0 - 2.0和12.0南