pyspark.RDD.takeOrdered¶
-
抽樣。
takeOrdered
( 全國礦工工會:int,關鍵:可選(可調用的((T],年代]]=沒有一個 )→列表(T] ¶ -
得到了N個元素從一個抽樣點按升序或指定的可選的關鍵功能。
筆記
這種方法應該隻用於如果生成的數組將小,因為所有數據加載到司機的記憶。
例子
> > >sc。並行化([10,1,2,9,3,4,5,6,7])。takeOrdered(6)(1、2、3、4、5、6)> > >sc。並行化([10,1,2,9,3,4,5,6,7),2)。takeOrdered(6,關鍵=λx:- - - - - -x)(10、9、7、6、5、4]