pyspark.pandas.DataFrame.aggregate¶
-
DataFrame。
總
( 函數:聯盟[列表(str), Dict[聯盟[任何元組[,…]],[力量]]列表) )→pyspark.pandas.frame.DataFrame¶ -
總軸指定使用一個或多個操作。
- 參數
-
- 函數 dict或列表
-
dict類型映射的列名稱(字符串)聚合函數(字符串)的列表。如果一個列表,對所有列進行聚合。
- 返回
-
- DataFrame
另請參閱
-
DataFrame.apply
-
DataFrame上調用函數。
-
DataFrame.transform
-
隻有執行類型轉換操作。
-
DataFrame.groupby
-
在執行操作組。
-
Series.aggregate
-
相當於函數級數。
筆記
gg是一個別名總。使用別名。
例子
> > >df=ps。DataFrame([[1,2,3),…(4,5,6),…(7,8,9),…(np。南,np。南,np。南]],…列=(“一個”,“B”,“C”])
> > >dfA B C0 1.0 2.0 3.01 4.0 5.0 6.02 7.0 8.0 9.03南南南
行聚合這些函數。
> > >df。gg([“和”,“最小值”))((“一個”,“B”,“C”]]。sort_index()A B C分鍾1.0 2.0 3.0和12.0 15.0 18.0
每列不同的聚合。
> > >df。gg({“一個”:(“和”,“最小值”),“B”:(“最小值”,“馬克斯”]})[[“一個”,“B”]]。sort_index()一個B馬克斯南8.0分鍾1.0 - 2.0和12.0南
多索引的列:
> > >df。列=pd。MultiIndex。from_tuples(((“X”,“一個”),(“X”,“B”),(“Y”,“C”)))> > >df。gg([“和”,“最小值”[[(])“X”,“一個”),(“X”,“B”),(“Y”,“C”)]]。sort_index()X YA B C分鍾1.0 2.0 3.0和12.0 15.0 18.0
> > >聚合=df。gg({(“X”,“一個”):(“和”,“最小值”),(“X”,“B”):(“最小值”,“馬克斯”]})> > >聚合[[(“X”,“一個”),(“X”,“B”)]]。sort_index()X一個B馬克斯南8.0分鍾1.0 - 2.0和12.0南