pyspark.pandas.Series.nsmallest

係列。 nsmallest ( n:int=5 )→pyspark.pandas.series.Series

返回最小的n元素。

參數
n int,默認5

返回這許多升序排序值。

返回
係列

n係列的最小值,排序在增加訂單。

另請參閱

Series.nlargest

得到了n最大的元素。

Series.sort_values

係列的值。

Series.head

返回第一個n行。

筆記

速度比.sort_values () .head (n)對小n相對於的大小係列對象。在pandas-on-Spark,多虧了火花的延遲執行和查詢優化器,兩個相同的性能。

例子

> > >數據=(1,2,3,4,np,6,7,8]> > >年代=ps係列(數據)> > >年代0 1.01 2.02 3.03 4.04南5 6.06 7.07 8.0dtype: float64

n最大的元素,n = 5默認情況下。

> > >年代nsmallest()0 1.01 2.02 3.03 4.05 6.0dtype: float64
> > >年代nsmallest(3)0 1.01 2.02 3.0dtype: float64