pyspark.sql.functions.min_by

pyspark.sql.functions。 min_by ( 上校:ColumnOrName,奧德:ColumnOrName )→pyspark.sql.column.Column

返回值與奧德的最小值。

參數
上校 或str

目標列將返回的值

奧德 或str

列是最小化

返回

價值與奧德的最小值。

例子

> > >df=火花createDataFrame([(“Java”,2012年,20000年),(“dotNET”,2012年,5000年),(“dotNET”,2013年,48000年),(“Java”,2013年,30000年)),模式=(“課程”,“年”,“收益”))> > >dfgroupby(“課程”)gg(min_by(“年”,“收益”))顯示()+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +| |當然min_by |(年收益)+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +Java | 2012 | || dotNET | 2012 |+ - - - - - - - - - - - - - - - - - - - - - - - - - - - - - +