pyspark.pandas.DataFrame.applymap

DataFrame。 applymap ( 函數:可調用的((任何],任何] )→pyspark.pandas.frame.DataFrame

一個函數應用於Dataframe elementwise。

這種方法適用於一個函數,接受每一個元素,並返回一個標量,DataFrame。

請注意

這個API函數執行一次來推斷的類型可能是非常昂貴的,例如,當聚合或排序後創建的數據集。

為了避免這種情況,指定返回類型函數例如,如下:

> > >def廣場(x)- >npint32:返回x* *2

pandas-on-Spark使用返回類型提示,不試圖推斷類型。

參數
函數 可調用的

Python函數,返回一個值從一個單一的值。

返回
DataFrame

DataFrame轉換。

例子

> > >df=psDataFrame([[1,2.12),(3.356,4.567]])> > >df0 10 1.000 2.1201)3.356 - 4.567
> > >defstr_len(x)- >int:返回len(str(x))> > >dfapplymap(str_len)0 10 3 41 5 5
> > >def權力(x)- >浮動:返回x* *2> > >dfapplymap(權力)0 10 1.000000 4.4944001)11.262736 - 20.857489

你可以省略類型提示,讓pandas-on-Spark推斷它的類型。

> > >dfapplymap(λx:x* *2)0 10 1.000000 4.4944001)11.262736 - 20.857489