pyspark.sql.functions.max_by

pyspark.sql.functions。 max_by ( 上校:ColumnOrName,奧德:ColumnOrName )→pyspark.sql.column.Column

返回值與奧德的最大值。

參數
上校 或str

目標列將返回的值

奧德 或str

列是最大化

返回

價值與奧德的最大值。

例子

> > >df=火花createDataFrame([(“Java”,2012年,20000年),(“dotNET”,2012年,5000年),(“dotNET”,2013年,48000年),(“Java”,2013年,30000年)),模式=(“課程”,“年”,“收益”))> > >dfgroupby(“課程”)gg(max_by(“年”,“收益”))顯示()+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +| |當然max_by |(年收益)+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +Java | 2013 | || dotNET | 2013 |+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +