pyspark.sql.functions.first

pyspark.sql.functions。 第一個 ( 上校:ColumnOrName,ignorenulls:bool= )→pyspark.sql.column.Column

聚合函數,返回一組中的第一個值。

功能在默認情況下它看到返回的第一個值。它將返回第一個非空值時看到ignoreNulls被設置為true。如果所有的值是null,那麼將返回null。

筆記

函數是不確定的,因為它的結果取決於訂單的行洗牌後可能是不確定的。

例子

> > >df=火花createDataFrame(((“愛麗絲”,2),(“Bob”,5)),(“名稱”,“年齡”))> > >dfgroupby(“名稱”)gg(第一個(“年齡”))orderBy(“名稱”)顯示()+ - - - - - - - - - - - - - - - - - +| | |第一名稱(年齡)+ - - - - - - - - - - - - - - - - - +愛麗絲| | 2 |鮑勃| | 5 |+ - - - - - - - - - - - - - - - - - +