pyspark.pandas.Index.spark.transform¶
-
火花。
變換
( 函數:可調用的((pyspark.sql.column.Column],pyspark.sql.column.Column] )→IndexOpsLike¶ -
適用於一個函數,並返回一個火花列。它允許本地應用火花與火花列和列api函數內部使用的串聯或索引。火花列的輸出長度應與輸入的相同。
請注意
它需要有相同的輸入和輸出長度;因此,聚合引發數不工作等功能。
- 參數
-
- 函數 函數
-
函數用於將數據通過使用火花列。
- 返回
-
- 係列或索引
- 提出了
-
- ValueError 如果函數的輸出不是一個火花列。
例子
> > >從pyspark.sql.functions進口日誌> > >df=ps。DataFrame({“一個”:(1,2,3),“b”:(4,5,6)},列=(“一個”,“b”])> > >df一個b0 1 41 2 52 3 6
> > >df。一個。火花。變換(λc:日誌(c))0 0.0000001 0.6931472 1.098612名稱:dtype: float64
> > >df。指數。火花。變換(λc:c+10)Int64Index ((10、11、12), dtype =“int64”)
> > >df。一個。火花。變換(λc:c+df。b。火花。列)0 51 72 9名稱:dtype: int64