pyspark.RDD.top

抽樣。 ( 全國礦工工會:int,關鍵:可選(可調用的((T],年代]]=沒有一個 )→列表(T]

從一個抽樣得到前N個元素。

筆記

這種方法應該隻用於如果生成的數組將小,因為所有數據加載到司機的記憶。

它返回列表在降序排序。

例子

> > >sc並行化([10,4,2,12,3])(1)[12]> > >sc並行化([2,3,4,5,6),2)(2)(6,5)> > >sc並行化([10,4,2,12,3])(3,關鍵=str)(4、3、2)