pyspark.pandas.Series.transform¶

係列。 變換 ( 函數:聯盟(可調用的,列表(可調用的]],軸:聯盟(int,str]=0,*arg遊戲:任何,* *kwargs:任何 )→聯盟(pyspark.pandas.series.Series,pyspark.pandas.frame.DataFrame] ¶

調用函數產生相同的類型自我用轉換值,具有相同的軸長度作為輸入。

請注意

這個API函數執行一次來推斷的類型可能是非常昂貴的,例如,當聚合或排序後創建的數據集。

為了避免這種情況,指定返回類型函數例如,如下:

            > > >def廣場(x)- >np。int32:…返回x* *2
           

pandas-on-Spark使用返回類型提示,不試圖推斷類型。

參數

返回

另請參閱

例子

           > > >年代=ps。係列(範圍(3))> > >年代0 012 - 2dtype: int64
          

           > > >def√6(x)- >浮動:…返回np。√6(x)> > >年代。變換(√6)0 0.0000001 1.0000002 1.414214dtype: float64
          

盡管結果的實例必須有相同的長度作為輸入,可以提供幾個輸入功能:

           > > >def經驗值(x)- >浮動:…返回np。經驗值(x)> > >年代。變換([√6,經驗值])√6經驗0 0.000000 1.0000001)1.000000 - 2.7182822 1.414214 - 7.389056
          

你可以省略類型提示,讓pandas-on-Spark推斷它的類型。

           > > >年代。變換([np。√6,np。經驗值])√6經驗0 0.000000 1.0000001)1.000000 - 2.7182822 1.414214 - 7.389056
          

以前的

pyspark.pandas.Series.aggregate

下一個

pyspark.pandas.Series.map