pyspark.pandas.groupby.GroupBy.transformgydF4y2Ba
GroupBy。gydF4y2Ba 變換gydF4y2Ba (gydF4y2Ba 函數gydF4y2Ba:gydF4y2Ba可調用的[[…],pandas.core.series.Series]gydF4y2Ba,gydF4y2Ba*gydF4y2Baarg遊戲gydF4y2Ba:gydF4y2Ba任何gydF4y2Ba,gydF4y2Ba* *gydF4y2BakwargsgydF4y2Ba:gydF4y2Ba任何gydF4y2Ba )gydF4y2Ba→FrameLikegydF4y2Ba

請注意gydF4y2Ba

這個API執行函數來推斷的類型gydF4y2Ba

潛在的昂貴,例如,當聚合或排序後創建的數據集。gydF4y2Ba

為了避免這種情況,指定返回類型gydF4y2Ba函數gydF4y2Ba例如,如下:gydF4y2Ba

> > >gydF4y2BadefgydF4y2Baconvert_to_stringgydF4y2Ba(gydF4y2BaxgydF4y2Ba)gydF4y2Ba- >gydF4y2BapsgydF4y2Ba。gydF4y2Ba係列gydF4y2Ba(gydF4y2BastrgydF4y2Ba]:gydF4y2Ba…gydF4y2Ba返回gydF4y2BaxgydF4y2Ba。gydF4y2Ba應用gydF4y2Ba(gydF4y2Ba“一個字符串gydF4y2Ba{}gydF4y2Ba”gydF4y2Ba。gydF4y2Ba格式gydF4y2Ba)gydF4y2Ba

當給定的函數返回類型注釋,GroupBy對象將丟失的原始指數和一個默認的索引將被附加到結果。請注意配置默認的索引。另請參閱gydF4y2Ba默認索引類型gydF4y2Ba。gydF4y2Ba

請注意gydF4y2Ba

這個係列中gydF4y2Ba函數gydF4y2Ba實際上是一個熊貓係列。因此,任何熊貓API在這個函數是允許的。gydF4y2Ba

參數gydF4y2Ba
函數gydF4y2Ba 可調用的gydF4y2Ba

一個可調用的一係列作為它的第一個參數,並返回一個係列。gydF4y2Ba

* argsgydF4y2Ba

位置參數傳遞給函數。gydF4y2Ba

* * kwargsgydF4y2Ba

關鍵字參數傳遞給函數。gydF4y2Ba

返回gydF4y2Ba
應用gydF4y2Ba DataFramegydF4y2Ba

另請參閱gydF4y2Ba

總gydF4y2Ba

聚合函數應用於GroupBy對象。gydF4y2Ba

Series.applygydF4y2Ba

應用一係列的函數。gydF4y2Ba

例子gydF4y2Ba

> > >gydF4y2BadfgydF4y2Ba=gydF4y2BapsgydF4y2Ba。gydF4y2BaDataFramegydF4y2Ba({gydF4y2Ba“一個”gydF4y2Ba:gydF4y2Ba(gydF4y2Ba0gydF4y2Ba,gydF4y2Ba0gydF4y2Ba,gydF4y2Ba1gydF4y2Ba),gydF4y2Ba…gydF4y2Ba“B”gydF4y2Ba:gydF4y2Ba(gydF4y2Ba1gydF4y2Ba,gydF4y2Ba2gydF4y2Ba,gydF4y2Ba3gydF4y2Ba),gydF4y2Ba…gydF4y2Ba“C”gydF4y2Ba:gydF4y2Ba(gydF4y2Ba4gydF4y2Ba,gydF4y2Ba6gydF4y2Ba,gydF4y2Ba5gydF4y2Ba)},gydF4y2Ba列gydF4y2Ba=gydF4y2Ba(gydF4y2Ba“一個”gydF4y2Ba,gydF4y2Ba“B”gydF4y2Ba,gydF4y2Ba“C”gydF4y2Ba])gydF4y2Ba
> > >gydF4y2BaggydF4y2Ba=gydF4y2BadfgydF4y2Ba。gydF4y2BagroupbygydF4y2Ba(gydF4y2Ba“一個”gydF4y2Ba)gydF4y2Ba

請注意,gydF4y2BaggydF4y2Ba有兩個組,gydF4y2Ba0gydF4y2Ba和gydF4y2Ba1gydF4y2Ba。調用gydF4y2Ba變換gydF4y2Ba以不同的方式,我們可以得到不同的分組結果:以下傳遞給函數gydF4y2Ba變換gydF4y2Ba需要一係列作為它的參數,並返回一個係列。gydF4y2Ba變換gydF4y2Ba應用函數在每個分組數據,每個係列,組合成一個新的DataFrame:gydF4y2Ba

> > >gydF4y2BadefgydF4y2Baconvert_to_stringgydF4y2Ba(gydF4y2BaxgydF4y2Ba)gydF4y2Ba- >gydF4y2BapsgydF4y2Ba。gydF4y2Ba係列gydF4y2Ba(gydF4y2BastrgydF4y2Ba]:gydF4y2Ba…gydF4y2Ba返回gydF4y2BaxgydF4y2Ba。gydF4y2Ba應用gydF4y2Ba(gydF4y2Ba“一個字符串gydF4y2Ba{}gydF4y2Ba”gydF4y2Ba。gydF4y2Ba格式gydF4y2Ba)gydF4y2Ba> > >gydF4y2BaggydF4y2Ba。gydF4y2Ba變換gydF4y2Ba(gydF4y2Baconvert_to_stringgydF4y2Ba)gydF4y2BaB CgydF4y2Ba0一個字符串1一個字符串4gydF4y2Ba1一個字符串2字符串6gydF4y2Ba2一個字符串3字符串5gydF4y2Ba
> > >gydF4y2BadefgydF4y2Baplus_maxgydF4y2Ba(gydF4y2BaxgydF4y2Ba)gydF4y2Ba- >gydF4y2BapsgydF4y2Ba。gydF4y2Ba係列gydF4y2Ba(gydF4y2BanpgydF4y2Ba。gydF4y2BaintgydF4y2Ba]:gydF4y2Ba…gydF4y2Ba返回gydF4y2BaxgydF4y2Ba+gydF4y2BaxgydF4y2Ba。gydF4y2Ba馬克斯gydF4y2Ba()gydF4y2Ba> > >gydF4y2BaggydF4y2Ba。gydF4y2Ba變換gydF4y2Ba(gydF4y2Baplus_maxgydF4y2Ba)gydF4y2BaB CgydF4y2Ba0 3 10gydF4y2Ba1 4 12gydF4y2Ba2 6 10gydF4y2Ba

你可以省略類型提示,讓pandas-on-Spark推斷它的類型。gydF4y2Ba

> > >gydF4y2BadefgydF4y2Baplus_mingydF4y2Ba(gydF4y2BaxgydF4y2Ba):gydF4y2Ba…gydF4y2Ba返回gydF4y2BaxgydF4y2Ba+gydF4y2BaxgydF4y2Ba。gydF4y2Ba最小值gydF4y2Ba()gydF4y2Ba> > >gydF4y2BaggydF4y2Ba。gydF4y2Ba變換gydF4y2Ba(gydF4y2Baplus_mingydF4y2Ba)gydF4y2BaB CgydF4y2Ba0 2 8gydF4y2Ba1 3 10gydF4y2Ba2 6 10gydF4y2Ba

係列,它的工作原理如下。gydF4y2Ba

> > >gydF4y2BadfgydF4y2Ba。gydF4y2BaBgydF4y2Ba。gydF4y2BagroupbygydF4y2Ba(gydF4y2BadfgydF4y2Ba。gydF4y2Ba一個gydF4y2Ba)gydF4y2Ba。gydF4y2Ba變換gydF4y2Ba(gydF4y2Baplus_maxgydF4y2Ba)gydF4y2Ba0 3gydF4y2Ba1 - 4gydF4y2Ba2 - 6gydF4y2Ba名稱:B, dtype: int64gydF4y2Ba
> > >gydF4y2Ba(gydF4y2BadfgydF4y2Ba*gydF4y2Ba- - - - - -gydF4y2Ba1gydF4y2Ba)gydF4y2Ba。gydF4y2BaBgydF4y2Ba。gydF4y2BagroupbygydF4y2Ba(gydF4y2BadfgydF4y2Ba。gydF4y2Ba一個gydF4y2Ba)gydF4y2Ba。gydF4y2Ba變換gydF4y2Ba(gydF4y2Ba腹肌gydF4y2Ba)gydF4y2Ba0 1gydF4y2Ba1 2gydF4y2Ba2 3gydF4y2Ba名稱:B, dtype: int64gydF4y2Ba

您還可以指定額外的參數傳遞給函數。gydF4y2Ba

> > >gydF4y2BadefgydF4y2Ba計算gydF4y2Ba(gydF4y2BaxgydF4y2Ba,gydF4y2BaygydF4y2Ba,gydF4y2BazgydF4y2Ba)gydF4y2Ba- >gydF4y2BapsgydF4y2Ba。gydF4y2Ba係列gydF4y2Ba(gydF4y2BanpgydF4y2Ba。gydF4y2BaintgydF4y2Ba]:gydF4y2Ba…gydF4y2Ba返回gydF4y2BaxgydF4y2Ba+gydF4y2BaxgydF4y2Ba。gydF4y2Ba最小值gydF4y2Ba()gydF4y2Ba+gydF4y2BaygydF4y2Ba+gydF4y2BazgydF4y2Ba> > >gydF4y2BaggydF4y2Ba。gydF4y2Ba變換gydF4y2Ba(gydF4y2Ba計算gydF4y2Ba,gydF4y2Ba5gydF4y2Ba,gydF4y2BazgydF4y2Ba=gydF4y2Ba20.gydF4y2Ba)gydF4y2BaB CgydF4y2Ba0 27 33gydF4y2Ba1 28 35gydF4y2Ba2 31 35gydF4y2Ba