pyspark.sql.functions.filter¶

pyspark.sql.functions。 過濾器 ( 上校:ColumnOrName,f:聯盟(可調用的((pyspark.sql.column.Column],pyspark.sql.column.Column],可調用的((pyspark.sql.column.Column,pyspark.sql.column.Column],pyspark.sql.column.Column]] )→pyspark.sql.column.Column¶

返回一個數組的元素一個謂詞適用於一個給定的數組。

參數

上校 列或str

的名字列或表達式

f 函數

一個函數,返回布爾表達式。可以采取下列形式之一:

一元(x):列)- >專欄:…
二進製(x):列,我:列)- >列……,第二個參數是

基於索引的元素。

和可以使用的方法列、函數中定義pyspark.sql.functions和ScalaUserDefinedFunctions。PythonUserDefinedFunctions不支持(火星- 27052)。

返回

列

例子

           > > >df=火花。createDataFrame(…((1,(“2018-09-20”,“2019-02-03”,“2019-07-01”,“2020-06-01”])),…(“關鍵”,“價值觀”)…)> > >defafter_second_quarter(x):…返回月(to_date(x))>6> > >df。選擇(…過濾器(“價值觀”,after_second_quarter)。別名(“after_second_quarter”)…)。顯示(截斷=假)+ - - - - - - - - - - - - - - - - - - - - - - - - +| after_second_quarter |+ - - - - - - - - - - - - - - - - - - - - - - - - +| | (2018-09-20,2018-09-20)+ - - - - - - - - - - - - - - - - - - - - - - - - +
          

以前的

pyspark.sql.functions.forall

下一個

pyspark.sql.functions.aggregate