pyspark.pandas.Series.spark.apply¶
-
火花。
應用
( 函數:可調用的((pyspark.sql.column.Column],pyspark.sql.column.Column] )→ps.Series¶ -
適用於一個函數,並返回一個火花列。它允許本地應用火花與火花列和列api函數內部使用的串聯或索引。
請注意
它迫使失去指數和最終使用默認的索引。優先使用
Series.spark.transform ()
或:甲:“DataFrame.spark.apply與指定inedx_col。請注意
它不需要有相同的長度的輸入和輸出。然而,它需要創建一個新的DataFrame內部需要設置compute.ops_on_diff_frames計算的同源DataFrame甚至是昂貴的,而
Series.spark.transform ()
不需要它。- 參數
-
- 函數 函數
-
應用函數對數據通過使用火花列。
- 返回
-
- 係列
- 提出了
-
- ValueError 如果函數的輸出不是一個火花列。
例子
> > >從pyspark進口熊貓作為ps> > >從pyspark.sql.functions進口數,點燃> > >df=ps。DataFrame({“一個”:(1,2,3),“b”:(4,5,6)},列=(“一個”,“b”])> > >df一個b0 1 41 2 52 3 6
> > >df。一個。火花。應用(λc:數(c))0 3名稱:dtype: int64
> > >df。一個。火花。應用(λc:c+df。b。火花。列)0 51 72 9名稱:dtype: int64