pyspark.pandas.Series.transform

係列。 變換 ( 函數:聯盟(可調用的,列表(可調用的]],:聯盟(int,str]=0,*arg遊戲:任何,* *kwargs:任何 )→聯盟(pyspark.pandas.series.Series,pyspark.pandas.frame.DataFrame]

調用函數產生相同的類型自我用轉換值,具有相同的軸長度作為輸入。

請注意

這個API函數執行一次來推斷的類型可能是非常昂貴的,例如,當聚合或排序後創建的數據集。

為了避免這種情況,指定返回類型函數例如,如下:

> > >def廣場(x)- >npint32:返回x* *2

pandas-on-Spark使用返回類型提示,不試圖推斷類型。

參數
函數 函數或列表

一個函數或一個函數用於改變數據的列表。

int,默認0或“指數”

目前隻能設置為0。

* args

位置參數傳遞函數

* * kwargs

關鍵字參數傳遞函數

返回
相同類型的一個實例自我必須有相同的長度作為輸入。

另請參閱

Series.aggregate

隻有執行聚合類型操作。

Series.apply

調用函數級數。

DataFrame.transform

DataFrame的等效功能。

例子

> > >年代=ps係列(範圍(3))> > >年代0 012 - 2dtype: int64
> > >def√6(x)- >浮動:返回np√6(x)> > >年代變換(√6)0 0.0000001 1.0000002 1.414214dtype: float64

盡管結果的實例必須有相同的長度作為輸入,可以提供幾個輸入功能:

> > >def經驗值(x)- >浮動:返回np經驗值(x)> > >年代變換([√6,經驗值])√6經驗0 0.000000 1.0000001)1.000000 - 2.7182822 1.414214 - 7.389056

你可以省略類型提示,讓pandas-on-Spark推斷它的類型。

> > >年代變換([np√6,np經驗值])√6經驗0 0.000000 1.0000001)1.000000 - 2.7182822 1.414214 - 7.389056