pyspark.pandas.Series.transform¶
-
係列。
變換
( 函數:聯盟(可調用的,列表(可調用的]],軸:聯盟(int,str]=0,*arg遊戲:任何,* *kwargs:任何 )→聯盟(pyspark.pandas.series.Series,pyspark.pandas.frame.DataFrame] ¶ -
調用
函數
產生相同的類型自我用轉換值,具有相同的軸長度作為輸入。請注意
這個API函數執行一次來推斷的類型可能是非常昂貴的,例如,當聚合或排序後創建的數據集。
為了避免這種情況,指定返回類型
函數
例如,如下:> > >def廣場(x)- >np。int32:…返回x* *2
pandas-on-Spark使用返回類型提示,不試圖推斷類型。
- 參數
-
- 函數 函數或列表
-
一個函數或一個函數用於改變數據的列表。
- 軸 int,默認0或“指數”
-
目前隻能設置為0。
- * args
-
位置參數傳遞函數。
- * * kwargs
-
關鍵字參數傳遞函數。
- 返回
-
- 相同類型的一個實例自我必須有相同的長度作為輸入。
另請參閱
-
Series.aggregate
-
隻有執行聚合類型操作。
-
Series.apply
-
調用函數級數。
-
DataFrame.transform
-
DataFrame的等效功能。
例子
> > >年代=ps。係列(範圍(3))> > >年代0 012 - 2dtype: int64
> > >def√6(x)- >浮動:…返回np。√6(x)> > >年代。變換(√6)0 0.0000001 1.0000002 1.414214dtype: float64
盡管結果的實例必須有相同的長度作為輸入,可以提供幾個輸入功能:
> > >def經驗值(x)- >浮動:…返回np。經驗值(x)> > >年代。變換([√6,經驗值])√6經驗0 0.000000 1.0000001)1.000000 - 2.7182822 1.414214 - 7.389056
你可以省略類型提示,讓pandas-on-Spark推斷它的類型。
> > >年代。變換([np。√6,np。經驗值])√6經驗0 0.000000 1.0000001)1.000000 - 2.7182822 1.414214 - 7.389056