pyspark.sql.functions.filter

pyspark.sql.functions。 過濾器 ( 上校:ColumnOrName,f:聯盟(可調用的((pyspark.sql.column.Column],pyspark.sql.column.Column],可調用的((pyspark.sql.column.Column,pyspark.sql.column.Column],pyspark.sql.column.Column]] )→pyspark.sql.column.Column

返回一個數組的元素一個謂詞適用於一個給定的數組。

參數
上校 或str

的名字列或表達式

f 函數

一個函數,返回布爾表達式。可以采取下列形式之一:

  • 一元(x):列)- >專欄:

  • 二進製(x):列,我:列)- >列……,第二個參數是

    基於索引的元素。

和可以使用的方法、函數中定義pyspark.sql.functions和ScalaUserDefinedFunctions。PythonUserDefinedFunctions不支持(火星- 27052)。

返回

例子

> > >df=火花createDataFrame(((1,(“2018-09-20”,“2019-02-03”,“2019-07-01”,“2020-06-01”])),(“關鍵”,“價值觀”))> > >defafter_second_quarter(x):返回(to_date(x))>6> > >df選擇(過濾器(“價值觀”,after_second_quarter)別名(“after_second_quarter”))顯示(截斷=)+ - - - - - - - - - - - - - - - - - - - - - - - - +| after_second_quarter |+ - - - - - - - - - - - - - - - - - - - - - - - - +| | (2018-09-20,2018-09-20)+ - - - - - - - - - - - - - - - - - - - - - - - - +