pyspark.pandas.Series.nlargest

係列。 nlargest ( n:int=5 )→pyspark.pandas.series.Series

返回的最大n元素。

參數
n int,默認5
返回
係列

n最大的值係列,降序排序。

另請參閱

Series.nsmallest

得到了n最小的元素。

Series.sort_values

係列的值。

Series.head

返回第一個n行。

筆記

速度比.sort_values(升序= False) .head (n)對小n相對於的大小係列對象。

在pandas-on-Spark,多虧了火花的延遲執行和查詢優化器,兩個相同的性能。

例子

> > >數據=(1,2,3,4,np,6,7,8]> > >年代=ps係列(數據)> > >年代0 1.01 2.02 3.03 4.04南5 6.06 7.07 8.0dtype: float64

n最大的元素,n = 5默認情況下。

> > >年代nlargest()7 8.06 7.05 6.03 4.02 3.0dtype: float64
> > >年代nlargest(n=3)7 8.06 7.05 6.0dtype: float64