pyspark.sql.functions.transform

pyspark.sql.functions。 變換 ( 上校:ColumnOrName,f:聯盟(可調用的((pyspark.sql.column.Column],pyspark.sql.column.Column],可調用的((pyspark.sql.column.Column,pyspark.sql.column.Column],pyspark.sql.column.Column]] )→pyspark.sql.column.Column

返回一個數組的元素應用轉換後輸入數組中的每個元素。

參數
上校 或str

的名字列或表達式

f 函數

一個函數,應用於輸入數組的每個元素。可以采取下列形式之一:

  • 一元(x):列)- >專欄:

  • 二進製(x):列,我:列)- >列……,第二個參數是

    基於索引的元素。

和可以使用的方法、函數中定義pyspark.sql.functions和ScalaUserDefinedFunctions。PythonUserDefinedFunctions不支持(火星- 27052)。

返回

例子

> > >df=火花createDataFrame(((1,(1,2,3,4])),(“關鍵”,“價值觀”))> > >df選擇(變換(“價值觀”,λx:x*2)別名(“翻倍”))顯示()+ - - - - - - - - - - - - +| |翻了一番+ - - - - - - - - - - - - +(2、4、6、8)| |+ - - - - - - - - - - - - +
> > >def備用(x,):返回(%2= =0,x)否則(- - - - - -x)> > >df選擇(變換(“價值觀”,備用)別名(“交替”))顯示()+ - - - - - - - - - - - - - - - - +|交替|+ - - - - - - - - - - - - - - - - +| | (1、2、3、4)+ - - - - - - - - - - - - - - - - +