pyspark.pandas.Series.apply

係列。 應用 ( 函數:可調用的,arg遊戲:序列(任何]=(),* *kwds:任何 )→pyspark.pandas.series.Series

調用函數的值。

隻能作用於一個Python函數。

請注意

這個API函數執行一次來推斷的類型可能是非常昂貴的,例如,當聚合或排序後創建的數據集。

為了避免這種情況,指定返回類型函數例如,如下:

> > >def廣場(x)- >npint32:返回x* *2

pandas-on-Spark使用返回類型提示,不試圖推斷類型。

參數
函數 函數

Python函數應用。注意,類型提示返回類型是必需的。

arg遊戲 元組

係列值後位置參數傳遞給函數。

* * kwds

額外的關鍵字參數傳遞給函數。

返回
係列

另請參閱

Series.aggregate

隻有執行聚合類型操作。

Series.transform

隻有執行類型轉換操作。

DataFrame.apply

DataFrame的等效功能。

例子

創建一係列與典型的夏季氣溫為每個城市。

> > >年代=ps係列([20.,21,12),指數=(“倫敦”,“紐約”,“赫爾辛基”])> > >年代倫敦20紐約21赫爾辛基12dtype: int64

平方值通過定義一個函數,將它作為參數傳遞給應用()

> > >def廣場(x)- >npint64:返回x* *2> > >年代應用(廣場)400年倫敦奧運會紐約441144年赫爾辛基dtype: int64

定義一個自定義函數,需要額外的位置參數,通過使用這些額外的參數arg遊戲關鍵字

> > >defsubtract_custom_value(x,custom_value)- >npint64:返回x- - - - - -custom_value
> > >年代應用(subtract_custom_value,arg遊戲=(5,))倫敦15紐約16赫爾辛基7dtype: int64

定義一個自定義函數,將關鍵字參數,通過這些參數應用

> > >defadd_custom_values(x,* *kwargs)- >npint64:kwargs:x+ =kwargs(]返回x
> > >年代應用(add_custom_values,6月=30.,7月=20.,8月=25)95年倫敦奧運會紐約9687年赫爾辛基dtype: int64

使用一個函數從Numpy庫

> > >defnumpy_log(上校)- >npfloat64:返回np日誌(上校)> > >年代應用(numpy_log)倫敦2.995732紐約3.044522赫爾辛基2.484907dtype: float64

你可以省略類型提示,讓pandas-on-Spark推斷它的類型。

> > >年代應用(np日誌)倫敦2.995732紐約3.044522赫爾辛基2.484907dtype: float64