pyspark.pandas.DataFrame.aggregate¶

DataFrame。 總 ( 函數:聯盟[列表(str), Dict[聯盟[任何元組[,…]],[力量]]列表) )→pyspark.pandas.frame.DataFrame¶

總軸指定使用一個或多個操作。

參數

函數 dict或列表: dict類型映射的列名稱(字符串)聚合函數(字符串)的列表。如果一個列表,對所有列進行聚合。

返回

DataFrame

另請參閱

DataFrame.apply: DataFrame上調用函數。
DataFrame.transform: 隻有執行類型轉換操作。
DataFrame.groupby: 在執行操作組。
Series.aggregate: 相當於函數級數。

筆記

gg是一個別名總。使用別名。

例子

           > > >df=ps。DataFrame([[1,2,3),…(4,5,6),…(7,8,9),…(np。南,np。南,np。南]],…列=(“一個”,“B”,“C”])
          

           > > >dfA B C0 1.0 2.0 3.01 4.0 5.0 6.02 7.0 8.0 9.03南南南
          

行聚合這些函數。

           > > >df。gg([“和”,“最小值”))((“一個”,“B”,“C”]]。sort_index()A B C分鍾1.0 2.0 3.0和12.0 15.0 18.0
          

每列不同的聚合。

           > > >df。gg({“一個”:(“和”,“最小值”),“B”:(“最小值”,“馬克斯”]})[[“一個”,“B”]]。sort_index()一個B馬克斯南8.0分鍾1.0 - 2.0和12.0南
          

多索引的列:

           > > >df。列=pd。MultiIndex。from_tuples(((“X”,“一個”),(“X”,“B”),(“Y”,“C”)))> > >df。gg([“和”,“最小值”[[(])“X”,“一個”),(“X”,“B”),(“Y”,“C”)]]。sort_index()X YA B C分鍾1.0 2.0 3.0和12.0 15.0 18.0
          

           > > >聚合=df。gg({(“X”,“一個”):(“和”,“最小值”),(“X”,“B”):(“最小值”,“馬克斯”]})> > >聚合[[(“X”,“一個”),(“X”,“B”)]]。sort_index()X一個B馬克斯南8.0分鍾1.0 - 2.0和12.0南
          

以前的

pyspark.pandas.DataFrame.agg

下一個

pyspark.pandas.DataFrame.groupby