pyspark.pandas.Series.nlargest¶
-
係列。
nlargest
( n:int=5 )→pyspark.pandas.series.Series¶ -
返回的最大n元素。
- 參數
-
- n int,默認5
- 返回
-
- 係列
-
的n最大的值係列,降序排序。
另請參閱
-
Series.nsmallest
-
得到了n最小的元素。
-
Series.sort_values
-
係列的值。
-
Series.head
-
返回第一個n行。
筆記
速度比
.sort_values(升序= False) .head (n)
對小n相對於的大小係列
對象。在pandas-on-Spark,多虧了火花的延遲執行和查詢優化器,兩個相同的性能。
例子
> > >數據=(1,2,3,4,np。南,6,7,8]> > >年代=ps。係列(數據)> > >年代0 1.01 2.02 3.03 4.04南5 6.06 7.07 8.0dtype: float64
的n最大的元素,
n = 5
默認情況下。> > >年代。nlargest()7 8.06 7.05 6.03 4.02 3.0dtype: float64
> > >年代。nlargest(n=3)7 8.06 7.05 6.0dtype: float64