pyspark.sql.functions.first¶
-
pyspark.sql.functions。
第一個
( 上校:ColumnOrName,ignorenulls:bool=假 )→pyspark.sql.column.Column¶ -
聚合函數,返回一組中的第一個值。
功能在默認情況下它看到返回的第一個值。它將返回第一個非空值時看到ignoreNulls被設置為true。如果所有的值是null,那麼將返回null。
筆記
函數是不確定的,因為它的結果取決於訂單的行洗牌後可能是不確定的。
例子
> > >df=火花。createDataFrame(((“愛麗絲”,2),(“Bob”,5)),(“名稱”,“年齡”))> > >df。groupby(“名稱”)。gg(第一個(“年齡”))。orderBy(“名稱”)。顯示()+ - - - - - - - - - - - - - - - - - +| | |第一名稱(年齡)+ - - - - - - - - - - - - - - - - - +愛麗絲| | 2 |鮑勃| | 5 |+ - - - - - - - - - - - - - - - - - +