pyspark.RDD.takeOrdered

抽樣。 takeOrdered ( 全國礦工工會:int,關鍵:可選(可調用的((T],年代]]=沒有一個 )→列表(T]

得到了N個元素從一個抽樣點按升序或指定的可選的關鍵功能。

筆記

這種方法應該隻用於如果生成的數組將小,因為所有數據加載到司機的記憶。

例子

> > >sc並行化([10,1,2,9,3,4,5,6,7])takeOrdered(6)(1、2、3、4、5、6)> > >sc並行化([10,1,2,9,3,4,5,6,7),2)takeOrdered(6,關鍵=λx:- - - - - -x)(10、9、7、6、5、4]